Ansichtenauswahl für die 3-D-Rekonstruktion statischer Szenen
Autori
Viac o knihe
Die 3-D-Rekonstruktion eines Objekts aus zwei oder mehr Intensitätsbildern gehört zu den klassischen Problemstellungen aus dem Bereich Rechnersehen. Kann man dabei aktiv in das System eingreifen, also gezielt auf die Parameter der Aufnahme einwirken, so spricht man vom „aktiven Sehen“. Die aktiven Parameter sind hier die Brennweite, die durch ein Zoomobjektiv gesteuert werden kann, sowie Position, d. h. Translation und Rotation, der Kamera. Die Kamera wird dabei durch einen Roboterarm in die gewünschte Position gebracht. Methoden des aktiven Sehens im Bereich der 3-D-Rekonstruktion befassen sich üblicherweise entweder mit dem Problem der Vollständigkeit der Rekonstruktion, im Sinne einer Szenenexploration, oder mit einer möglichst präzisen Bestimmung der 3-D-Geometrie. Ferner gibt es Ansätze die einen Kompromiss zwischen diesen beiden Zielsetzungen herstellen. In der vorliegenden ArbeitwerdenMethoden des aktiven Sehens benutzt, um eine möglichst präzise 3-D-Rekonstruktion zu berechnen. Hierzu werden aus den Aufnahmen Merkmalspunkte extrahiert und deren 3-D-Koordinaten anschließend geschätzt. In dieser Arbeit werden dazu zwei unterschiedliche Ansätze entwickelt und evaluiert: ein geometrischer Ansatz für Stereosysteme und ein probabilistischer Ansatz. Der geometrische Ansatz betrachtet Stereosysteme, also Systeme, die aus genau zwei Kameras bestehen. Der Einfluss der aktiven Parameter (Translation, Rotation und Brennweite) auf die Genauigkeit der 3-D-Rekonstruktion wird systematisch untersucht und, wo es möglich ist, analytisch bewiesen. Im probabilistischen Ansatz wird, basierend auf der aktuellen Schätzung der 3-D-Koordinaten, die nächste beste Ansicht ermittelt, d. h. die, die die Präzision der Schätzung bestmöglich erhöht. Hierzu wird die 3-D-Rekonstruktion als Zustandsschätzproblem formuliert, welchesmit Hilfe des erweiterten Kalman-Filters gelöst wird. Dadurch ist es möglich, basierend auf der aktuellen Schätzung, weitere Aufnahmen zu machen und in die Schätzung zu integrieren. In dieser Arbeit wird bewiesen, dass sich der Rechenaufwand der Kalman-Filter-Gleichungen durch geeignete Annahmen drastisch reduzieren lässt. Es wird dabei diskutiert, warum diese Annahmen für die 3-D-Rekonstruktion sinnvoll sind. Ein zu rekonstruierender 3-D-Punkt eines Objekts ist im Allgemeinen nicht von jeder beliebigen Ansicht aus zu sehen Deshalb muss die Sichtbarkeit bei der Planung berücksichtigt werden. Zum einen wird in dieser Arbeit gezeigt, wie man die Wahrscheinlichkeit, ob ein Punkt in einer bestimmten Ansicht sichtbar ist, berechnen kann. Zum anderen wird bewiesen, wie sich die Sichtbarkeitsbedingung geschlossen in das Optimierungskriterium für eine neue Ansicht integrieren lässt. Für die Ansichtenplanung ist schließlich entscheidend, die Kamera mit Hilfe eines Roboters an der gewünschten Stelle zu positionieren. Deshalb stellt sich die Frage, welche Positionen von dem verwendeten Roboterarm erreicht werden können. In der einschlägigen Literatur zur Ansichtenplanung für die 3-D-Rekonstruktion wird diese Fragestellung entweder gar nicht behandelt oder stets angenommen, dass sich die möglichen Kamerapositionen auf einer (Teil-) Kugel um das Objekt herum befinden. Im Gegensatz dazu wird hier mit Hilfe der sog. Denavit-Hartenberg-Matrix der Arbeitsbereich eines Roboterarms vollständig beschrieben. So können alle Positionen, die von dem jeweils verwendeten Roboterarm erreichbar sind, mit in die Ansichtenplanung einbezogen werden. Eine Beschränkung auf eine (Teil-)Kugel ist in diesem Fall dann unnötig.