h1

h2

h3

h4

h5
h6


001     985219
005     20251001165145.0
024 7 _ |2 HBZ
|a HT030733013
024 7 _ |2 Laufende Nummer
|a 43273
024 7 _ |2 datacite_doi
|a 10.18154/RWTH-2024-04533
037 _ _ |a RWTH-2024-04533
041 _ _ |a English
082 _ _ |a 620
100 1 _ |0 P:(DE-82)IDM02929
|a Redick, Tim
|b 0
|u rwth
245 _ _ |a Bayesian inference for CAD-based pose estimation on depth images for robotic manipulation
|c vorgelegt von Tim Redick geb. Übelhör
|h online
246 _ 3 |a Bayessche Inferenz für CAD-basierte Posenschätzung auf Tiefenbildern zur Roboter-Objektmanipulation
|y German
260 _ _ |a Aachen
|b RWTH Aachen University
|c 2024
300 _ _ |a 1 Online-Ressource : Illustrationen
336 7 _ |0 2
|2 EndNote
|a Thesis
336 7 _ |0 PUB:(DE-HGF)11
|2 PUB:(DE-HGF)
|a Dissertation / PhD Thesis
|b phd
|m phd
336 7 _ |2 BibTeX
|a PHDTHESIS
336 7 _ |2 DRIVER
|a doctoralThesis
336 7 _ |2 DataCite
|a Output Types/Dissertation
336 7 _ |2 ORCID
|a DISSERTATION
500 _ _ |a Veröffentlicht auf dem Publikationsserver der RWTH Aachen University
502 _ _ |a Dissertation, Rheinisch-Westfälische Technische Hochschule Aachen, 2024
|b Dissertation
|c Rheinisch-Westfälische Technische Hochschule Aachen
|d 2024
|g Fak04
|o 2024-04-15
520 3 _ |a Kamerabasierte 6D Posenschätzung ist insbesondere im Kontext der Roboter-Objektmanipulation von Bedeutung [1]. Roboter benötigen diese, um lokale Pläne wie Greifpunkte aus dem Koordinatensystem eines Objekts in das des Roboters zu transformieren. Diese Arbeit hat ihren Ursprung in medizinischen Anwendungen wie der Schätzung der 6D-Position von chirurgischen Instrumenten und dem Tracking von Knochen. Jedoch bieten industrielle Anwendungen ähnliche Herausforderungen: Texturen fehlen oder sind unzuverlässig, und Teile des Objekts können verdeckt sein. Im Gegensatz zu Deep Learning, dem aktuellen Goldstandard in der Bildverarbeitung, benötigen Bayessche Methoden in der Regel keine großen Datensätze und ermöglichen eine intuitive Einbindung weiterer Sensoren. Darüber hinaus können die geschätzten Unsicherheiten eine informierte Entscheidungsfindung ermöglichen. Im Vergleich zu Deep Learning wird in der Bayesschen Inferenz zur Bildverarbeitung die verfügbare Rechenleistung von GPUs unzureichend genutzt, was diese Methoden zurückhält. In dieser Arbeit werden probabilistische Modelle für die Bayessche Inferenz auf Tiefenbildern mit bekannten CAD-Modellen entwickelt und samplingbasierte Inferenzalgorithmen angepasst. Lediglich ein Vorwissen über die Position eines Objektpunktes ist erforderlich. Durch die Verwendung einer GPU wird die Laufzeit der Methode so weit verkürzt, dass der Einsatz im Rahmen robotischer Objektmanipulation möglich ist. Die Einflüsse verschiedener Modellkomponenten werden systematisch evaluiert. Schließlich wird die Vielseitigkeit der gezeigten Methoden für die Posenschätzung in diversen Anwendungen gezeigt: Industrielle Objekte, chirurgische Instrumente und das Tracking von Knochenposen. Die Ergebnisse zeigen, dass Laufzeiten von <1 s pro Objekt möglich sind, während ein durchschnittlicher Recall von 0,475 auf BOP Datensätzen für ungesehene Objekte erreicht wird. Der Stand der Technik erreicht einen Recall von 0,674, benötigt jedoch zusätzlich Farbbilder und Laufzeiten pro Bild von >30 s [2]. Die Bayessche Poseninferenz ist bei begrenzter Laufzeit kompetitiv. Da die Modelle kein semantisches Verständnis haben, könnte die Kombination mit lernbasierten Methoden ein vielversprechender Ansatz für künftige Forschungen sein.
|l ger
520 _ _ |a Camera-based 6D Pose estimation is specifically relevant in the context of robotic manipulation and augmented reality [1]. Robots require the pose estimates to transform local plans, such as grasp points from the object's coordinate frame to the robot's base frame. This thesis originated in medical applications, e.g., estimating the 6D pose of surgical instruments and tracking bones. The challenges are, however, similar to many industrial applications: Textures are missing or unreliable, and parts of the object might be occluded. Unlike deep learning methods, which recently dominated computer vision, probabilistic/Bayesian methods can operate without large datasets and intuitively fuse other sensor measurements or user inputs. Moreover, probabilistic methods include uncertainty estimates, enabling decision-making, e.g., by exploring different viewpoints instead of cutting a bone if the uncertainty is high. Compared to deep learning, insufficient utilization of the computational power of graphics processing unit (GPU) holds back Bayesian inference on images. This work develops probabilistic models and adapts sampling-based Bayesian inference algorithms for the 6D object pose estimation with known CAD models using depth images from a 3D camera. It only requires a prior for the position of a point, which can be provided, e.g., by attaching tags to the objects or a surgeon pointing onto a bone. Utilizing a GPU improves the method's runtime to enable robotic manipulation applications. Moreover, the experiments ablate the influence of different model components and inference algorithms. Finally, this thesis demonstrates the methods' versatility in different applications: industry-relevant BOP datasets, a synthetic dataset of surgical instruments, and tracking the pose of a bone. The results show that per-object runtimes of ≈1 s are possible, while achieving an average recall of 0.475 on BOP for unseen objects. State-of-the-art methods participating in the same category achieve recalls of 0.674, but additionally require color images and per-image runtimes >30 s [2]. The Bayesian pose inference is competitive if the runtime is limited. As the models have no semantic understanding, combining them with learning-based methods might be a promising direction for future research.
|l eng
588 _ _ |a Dataset connected to Lobid/HBZ
591 _ _ |a Germany
653 _ 7 |a 6D pose estimation
653 _ 7 |a Bayesian inference
653 _ 7 |a GPU
653 _ 7 |a camera
653 _ 7 |a computer vision
653 _ 7 |a robotics
700 1 _ |0 P:(DE-82)IDM03056
|a Abel, Dirk
|b 1
|e Thesis advisor
|u rwth
700 1 _ |a Hammer, Barbara
|b 2
|e Thesis advisor
856 4 _ |u https://publications.rwth-aachen.de/record/985219/files/985219.pdf
|y OpenAccess
856 4 _ |u https://publications.rwth-aachen.de/record/985219/files/985219_AV.pdf
|y Restricted
856 4 _ |u https://publications.rwth-aachen.de/record/985219/files/985219_source.zip
|y Restricted
909 C O |o oai:publications.rwth-aachen.de:985219
|p dnbdelivery
|p driver
|p VDB
|p open_access
|p openaire
910 1 _ |0 I:(DE-588b)36225-6
|6 P:(DE-82)IDM02929
|a RWTH Aachen
|b 0
|k RWTH
910 1 _ |0 I:(DE-588b)36225-6
|6 P:(DE-82)IDM03056
|a RWTH Aachen
|b 1
|k RWTH
914 1 _ |y 2024
915 _ _ |0 StatID:(DE-HGF)0510
|2 StatID
|a OpenAccess
920 1 _ |0 I:(DE-82)416610_20140620
|k 416610
|l Lehrstuhl und Institut für Regelungstechnik
|x 0
980 1 _ |a FullTexts
980 _ _ |a I:(DE-82)416610_20140620
980 _ _ |a UNRESTRICTED
980 _ _ |a VDB
980 _ _ |a phd


LibraryCollectionCLSMajorCLSMinorLanguageAuthor
Marc 21