000846867 001__ 846867 000846867 005__ 20251014113704.0 000846867 0247_ $$2HBZ$$aHT021381846 000846867 0247_ $$2Laufende Nummer$$a41293 000846867 0247_ $$2datacite_doi$$a10.18154/RWTH-2022-04921 000846867 037__ $$aRWTH-2022-04921 000846867 041__ $$aEnglish 000846867 082__ $$a621.3 000846867 1001_ $$0P:(DE-588)125890652X$$aBakhshi Golestani, Hossein$$b0$$urwth 000846867 245__ $$a3D geometry for 2D video compression$$cvorgelegt von Hossein Bakhshi Golestani, M.Sc.$$honline 000846867 260__ $$aAachen$$bRWTH Aachen University$$c2021 000846867 260__ $$c2022 000846867 300__ $$a1 Online-Ressource : Illustrationen 000846867 3367_ $$02$$2EndNote$$aThesis 000846867 3367_ $$0PUB:(DE-HGF)11$$2PUB:(DE-HGF)$$aDissertation / PhD Thesis$$bphd$$mphd 000846867 3367_ $$2BibTeX$$aPHDTHESIS 000846867 3367_ $$2DRIVER$$adoctoralThesis 000846867 3367_ $$2DataCite$$aOutput Types/Dissertation 000846867 3367_ $$2ORCID$$aDISSERTATION 000846867 500__ $$aVeröffentlicht auf dem Publikationsserver der RWTH Aachen University 2022 000846867 502__ $$aDissertation, Rheinisch-Westfälische Technische Hochschule Aachen, 2021$$bDissertation$$cRheinisch-Westfälische Technische Hochschule Aachen$$d2021$$gFak06$$o2021-12-08 000846867 5203_ $$aDer Videodatenverkehr, einschließlich Video-Streaming und Downloads, macht mehr als 80 % des gesamten Internetdatenverkehrs aus. Angesichts der wachsenden Nachfrage sowohl nach hochwertigen Videoinhalten, z. B. für Videoanrufe, E-Learning, Unterhaltung, als auch nach immersiven Technologien (z. B. 360-Videos, erweiterte Realität) ist die Entwicklung effizienterer Videokomprimierungstechnologien unumgänglich. Die meisten 2D-Videos wurden ursprünglich in einer 3D-Umgebung aufgenommen; daher kann die Projektion von 2D-Frames zurück in den 3D-Raum und die Nutzung der dortigen Informationen einen höheren Codierungsgewinn bieten. Diese Dissertation hat ein effizientes 2D-Videokompressionsverfahren entwickelt, das die 3D-Szenengeometrie (d.h. Punktwolke oder Mesh) und die Kamerabewegung schätzt und eine Vorhersage für zukünftige, noch nicht gesehene Bilder macht. Die gerenderte Vorhersage wird als neues Referenzbild für den Bewegungsausgleich verwendet. Diese Methode kann auf jedes Videocodierungsszenario mit Kamerabewegungen angewendet werden, z. B. Smartphones, autonomes Fahren, Überwachungssysteme usw. Außer einer monokularen Kamera ist kein besonderer Sensor (wie Tiefensensor, Trägheitsmesssensoren oder GPS) erforderlich; zusätzliche Sensoren erhöhen jedoch den Codierungsgewinn. Die Vorteile der vorgeschlagenen Technologie wurden in einer international betriebenen Testumgebung demonstriert. Diese Vorteile werden durch die Einführung dieser Technologie in die internationale Standardisierung allen Nutzern auf der Welt zugänglich gemacht, und Im Vergleich zum VVC-Standard (Versatile Video Coding) wurden etwa 3 % der Bitrate eingespart.$$lger 000846867 520__ $$aVideo data traffic, including video streaming and downloads, accounts for more than 80% of all consumer internet traffic. Considering the growing demand for both high-quality video content, e.g., for video calls, e-learning, or entertainment as well as for immersive technologies (e.g., 360 videos, extended reality), developing more efficient video compression technologies is inevitable. Most 2D videos have initially been captured in a 3D environment; thus, projecting 2D frames back into 3D space and exploiting information there can provide higher coding gain. This dissertation has developed an efficient 2D video compression method by estimating 3D scene geometry (i.e., point cloud or mesh) and camera motion and rendering a prediction for future un-seen frames. The rendered prediction is used as a new reference picture for motion compensation. This method can be applied to every video coding scenario with camera motion, e.g., smartphones, autonomous driving, surveillance systems, etc. No particular sensor (like depth sensor, inertial measurement sensors, or GPS) is required but a monocular camera; however, extra sensors increase the coding gain. The benefits of the proposed video coding method have been demonstrated in an internationally maintained testing environment and showed around 3% bit rate saving compared to VVC (Versatile Video Coding) standard.$$leng 000846867 588__ $$aDataset connected to Lobid/HBZ 000846867 591__ $$aGermany 000846867 653_7 $$a3D geometry 000846867 653_7 $$a3D reconstruction 000846867 653_7 $$aSLAM 000846867 653_7 $$aVVC 000846867 653_7 $$amesh compression 000846867 653_7 $$avideo coding 000846867 7001_ $$0P:(DE-82)IDM03926$$aOhm, Jens-Rainer$$b1$$eThesis advisor$$urwth 000846867 7001_ $$aBull, David$$b2$$eThesis advisor 000846867 8564_ $$uhttps://publications.rwth-aachen.de/record/846867/files/846867.pdf$$yOpenAccess 000846867 8564_ $$uhttps://publications.rwth-aachen.de/record/846867/files/846867_source.zip$$yRestricted 000846867 909CO $$ooai:publications.rwth-aachen.de:846867$$pdnbdelivery$$pdriver$$pVDB$$popen_access$$popenaire 000846867 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-588)125890652X$$aRWTH Aachen$$b0$$kRWTH 000846867 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)IDM03926$$aRWTH Aachen$$b1$$kRWTH 000846867 9141_ $$y2021 000846867 915__ $$0StatID:(DE-HGF)0510$$2StatID$$aOpenAccess 000846867 9201_ $$0I:(DE-82)613210_20140620$$k613210$$lLehrstuhl und Institut für Nachrichtentechnik$$x0 000846867 961__ $$c2022-06-23T11:55:32.276014$$x2022-05-13T17:46:48.020584$$z2022-06-23T11:55:32.276014 000846867 9801_ $$aFullTexts 000846867 980__ $$aI:(DE-82)613210_20140620 000846867 980__ $$aUNRESTRICTED 000846867 980__ $$aVDB 000846867 980__ $$aphd