Матриця камери
У комп'ютерному зорі матриця камери або матриця проєкції (камери) є матрицею , яка описує відображення стенопа від 3D-точок в світі, до 2D-точок зображення. Нехай — представлення тривимірної точки в однорідних координатах (чотиривимірний вектор), і нехай буде представленням зображення цієї точки в стенопі (3-вимірний вектор). Тоді має місце наступне співвідношення
де — це матриця камери, а знак, що означає, що ліва і права частини рівності рівні ненульовому скалярному множенню.
Так як матриця камери бере участь у відображенні між елементами двох проєктивних просторів, її теж можна розглядати як проєктивний елемент. Це означає, що у неї є тільки 11 ступенів свободи, так як будь-яке множення на ненульовий скаляр призводить до еквівалентної матриці камери.
Відображення координат тривимірної точки P на координати двовимірного зображення проєкції точки на площину зображення, відповідно до моделі стенопа, дається формулою
де є тривимірними координатами P щодо централізованої системи координат камери, — отримані координати зображення, f — фокусна відстань камери, для якої передбачається, що f > 0. Крім того, ми також припускаємо, що x3 > 0.
Для отримання матриці камери цей вираз переписується в термінах однорідних координат. Замість двовимірного вектора розглянемо проєктивний елемент (3D-вектор) та замість рівності розглядаємо рівність з точністю до масштабування на ненульове число, що позначається . Спочатку ми записуємо координати однорідного зображення у вигляді виразів в звичайних тривимірних координатах.
Нарешті, також тривимірні координати виражаються в однорідному представленні , і ось як виглядає матриця камери:
- чи
де матриця камери, яка дається формулою
- ,
і відповідна матриця камери тепер стає
Останній крок є наслідком того, що сам по собі є проєктивним елементом.
Виведена тут матриця камери може здатися тривіальною в тому сенсі, що вона містить дуже мало ненульових елементів. Це в значній мірі залежить від конкретних систем координат, які були обрані для 3D і 2D точок. На практиці, однак, інші форми матриць камер є загальними, що буде показано нижче.
Матриця камери , отримана в попередньому розділі, має нульовий простір, натягнуте на вектор
Це також однорідне уявлення тривимірної точки, яка має координати (0,0,0), тобто «центр камери» (так зване вхідне вічко; положення отвору стенопа), що знаходиться в O.
Для будь-якої іншої 3D-точки з , результат коректно визначений і має вигляд . Це відповідає нескінченно віддаленій точці на площині проєктованого зображення (навіть якщо площина зображення вибрана як евклідова площина, то не існує відповідної точки перетину).
Матриця камери, отримана вище, може бути спрощена ще більше, якщо ми припустимо, що f = 1:
де тут позначає одиничну матрицю . Зверніть увагу, що matrix тут розділена на конкатенацію матриці і тривимірного вектору. Матриця камери іноді називається канонічної формою.
До сіх пір всі точки в тривимірному світі були представлені в системі координат відцентрованої камери, тобто в системі координат, яка має початок в центрі камери (місце розташування точкового отвору стенопа). На практиці, однак, 3D-точки можуть бути представлені в термінах координат відносно довільної системи координат (X1',X2',X3'). Припускаючи, що координатні осі камери (X1,X2,X3) і осі (X1',X2',X3') мають Евклідів тип (ортогональний і ізотропний), існує єдине Евклідове тривимірне перетворення (поворот і зрушення) між двома системами координат. Іншими словами, камера не обов'язково знаходиться на початку координат і дивиться уздовж осі z.
Дві операції обертання і зсуву тривимірних координат можуть бути представлені у вигляді двох матриць
- and
де є матрицею повороту , а є тривимірним вектором паралельного перенесення. Коли перша матриця множиться на однорідне уявлення 3D-точки, результатом є однорідне уявлення поверненої точки, а друга матриця виконує замість цього паралельне перенесення. Виконання двох операцій послідовно, тобто спочатку поворот, а потім паралельне перенесення (з вектором паралельного перенесення, заданим у вже поверненій системі координат), дає комбіновану матрицю повороту і паралельного перенесення
Припускаючи, що і — це точно обертання та перенесення, які пов'язані з двома системами координат (X1,X2,X3) і (X1',X2',X3') вище, це означає, що
де — однорідне уявлення точки P в системі координат (X1',X2',X3').
Припускаючи також, що матриця камери задана , відображення з координат в (X1',X2',X3') до однорідних координатам зображення стає
Отже, матриця камери, яка пов'язує точки в системі координат (X1',X2',X3') з координатами зображення, є
конкатенація матриці 3D обертання і тривимірного вектора перенесення.
Цей тип матриці камери називають нормованою матрицею камери, вона приймає фокусну відстань = 1 і координати зображення вимірюються в системі координат, де початок координат знаходиться на перетині між віссю X3 і площиною зображення, і має ті ж одиниці як тривимірна система координат. Отримані координати зображення називаються координатами нормованого зображення.
Знову ж, описаний вище нульове простір нормованої матриці камери, описана вище , натягнуто на 4-мірний вектор
Це, знову ж, координати центру камери, тепер відносно системи (X1',X2',X3'). Це можна побачити, застосувавши спочатку поворот, а потім паралельний перенос до тривимірного вектору і результат є однорідним представленням тривимірних координат (0,0,0).
Це означає, що центр камери (в її однорідному поданні) знаходиться в нульовому просторі матриці камери, за умови, що він представлений у вигляді тривимірних координат відносно тієї ж системи координат, до якої відноситься матриця камери.
Нормовану матрицю камери можна тепер записати у вигляді
де — це тривимірні координати камери відносно системи (X1',X2',X3').
З огляду на відображення, створене нормованою матрицею камери, отримані координати нормованого зображення можуть бути перетворені за допомогою довільної двовимірної гомографіі. Це включає двовимірний перенос та обертання, а також масштабування (изотропне і анізотропне), але, також, і загальні двовимірні перспективні перетворення. Таке перетворення може бути представлено як матриця matrix , яка відображає координати нормованого зображення до координат перетвореного однорідного зображення :
Вставка вищенаведеного виразу для координат нормованого зображення у вигляді тривимірних координат дає
Це дає найбільш загальну форму матриці камери
- Richard Hartley and Andrew Zisserman (2003). Multiple View Geometry in computer vision. Cambridge University Press. ISBN 0-521-54051-8.