Logo
    • English
    • Ελληνικά
    • Deutsch
    • français
    • italiano
    • español
  • Ελληνικά 
    • English
    • Ελληνικά
    • Deutsch
    • français
    • italiano
    • español
  • Σύνδεση
Προβολή τεκμηρίου 
  •   Ιδρυματικό Αποθετήριο Πανεπιστημίου Θεσσαλίας
  • Επιστημονικές Δημοσιεύσεις Μελών ΠΘ (ΕΔΠΘ)
  • Δημοσιεύσεις σε περιοδικά, συνέδρια, κεφάλαια βιβλίων κλπ.
  • Προβολή τεκμηρίου
  •   Ιδρυματικό Αποθετήριο Πανεπιστημίου Θεσσαλίας
  • Επιστημονικές Δημοσιεύσεις Μελών ΠΘ (ΕΔΠΘ)
  • Δημοσιεύσεις σε περιοδικά, συνέδρια, κεφάλαια βιβλίων κλπ.
  • Προβολή τεκμηρίου
JavaScript is disabled for your browser. Some features of this site may not work without it.
Ιδρυματικό Αποθετήριο Πανεπιστημίου Θεσσαλίας
Όλο το DSpace
  • Κοινότητες & Συλλογές
  • Ανά ημερομηνία δημοσίευσης
  • Συγγραφείς
  • Τίτλοι
  • Λέξεις κλειδιά

A Deep Reinforcement Learning Motion Control Strategy of a Multi-rotor UAV for Payload Transportation with Minimum Swing

Thumbnail
Συγγραφέας
Panetsos F., Karras G.C., Kyriakopoulos K.J.
Ημερομηνία
2022
Γλώσσα
en
DOI
10.1109/MED54222.2022.9837220
Λέξη-κλειδί
Aircraft control
Deep learning
Learning algorithms
Reinforcement learning
Control strategies
Coupled dynamics
Deterministics
Multirotors
Neural-networks
Policy gradient
Reinforcement learning algorithms
Reinforcement learnings
Suspended loads
Swinging motions
Unmanned aerial vehicles (UAV)
Institute of Electrical and Electronics Engineers Inc.
Εμφάνιση Μεταδεδομένων
Επιτομή
This paper addresses the problem of controlling a multirotor UAV with a cable-suspended load. In order to ensure the safe transportation of the load, the swinging motion, induced by the strongly coupled dynamics, has to be minimized. Specifically, using the Twin Delayed Deep Deterministic Policy Gradient (TD3) Reinforcement Learning algorithm, a policy Neural Network is trained in a model-free manner which navigates the vehicle to the desired waypoints while, simultaneously, compensating for the load oscillations. The learned policy network is incorporated into the cascaded control architecture of the autopilot by replacing the common PID position controller and, thus, communicating directly with the inner attitude one. The performance of the proposed policy is demonstrated through a comparative simulation and experimental study while using an octorotor UAV. © 2022 IEEE.
URI
http://hdl.handle.net/11615/77485
Collections
  • Δημοσιεύσεις σε περιοδικά, συνέδρια, κεφάλαια βιβλίων κλπ. [19735]

Related items

Showing items related by title, author, creator and subject.

  • Thumbnail

    Εξυπνοι και αλληλεπιδρώμενοι πράκτορες e-learning, smartive e-learning agents - smart and interactive e-learning agents 

    Μόσχος, Λάκης (2011)
  • Thumbnail

    Μηχανική και ενισχυτική μάθηση μέσω του αλγορίθμου Q-learning 

    Μπάτσιος, Ιωάννης (2021)
  • Thumbnail

    Motivating Engineer Students in E-learning Courses with Problem Based Learning and Self-Regulated Learning on the apT2CLE4‘Research Methods’ Environment 

    Paraskeva F., Alexiou A., Bouta H., Mysirlaki S., Sotiropoulos D.J., Souki A.-M. (2019)
    More and more university programs try to establish an understanding of research methodology with relevant courses at undergraduate schools. Engineer students should have adequate academic training and experience to gain ...
htmlmap 

 

Πλοήγηση

Όλο το DSpaceΚοινότητες & ΣυλλογέςΑνά ημερομηνία δημοσίευσηςΣυγγραφείςΤίτλοιΛέξεις κλειδιάΑυτή η συλλογήΑνά ημερομηνία δημοσίευσηςΣυγγραφείςΤίτλοιΛέξεις κλειδιά

Ο λογαριασμός μου

ΣύνδεσηΕγγραφή (MyDSpace)
Πληροφορίες-Επικοινωνία
ΑπόθεσηΣχετικά μεΒοήθειαΕπικοινωνήστε μαζί μας
Επιλογή ΓλώσσαςΌλο το DSpace
EnglishΕλληνικά
htmlmap