斎藤(英)研究室ではコンピュータビジョン(Computer Vision:CV)について研究しています. CVとは,人間の視覚機能の計算機による実現を目指して人工知能研究から発展した分野で,ロボット用視覚システムのための画像から放送や映画の映像に至るまで,カメラで撮影した画像情報を認識・理解する研究と言えます. 研究室のメンバーは,このCVをキーワードにした理論研究から応用研究まで,色々なテーマの研究を繰り広げています.
研究は一人一つ以上のテーマを持っています.各生徒が先生と定期的に進捗の確認や今後の方針などのディスカッションを行っています.
本サイトでは,斎藤研の研究内容を大きく4つのグループに分けて紹介します.

斎藤研ではAugmentedReality(拡張現実感)に関連した技術研究を行っています.
ARは現実世界に対してバーチャルな情報を違和感なく合成し,使う人にとって直感的な映像を提示できる技術です.


照明環境が違う2つの画像を合成すると不自然な明るさの画像ができあがるが,それぞれの照明と3次元形状をもとに,自然な明るさの画像を生成します.


三次元物体の映像から,その物体の特徴を元に物体の角度を推定して,ARを行っています.


線分を検出して対応をとることで,より安定してカメラの位置を推定し,ARマーカーを用いることなくAR表示をすることができます.基本的な,point-to-pointの対応の応用研究です.

Kinectなどの深度データの取れるカメラを用いることによって,3D点群データを得ることができます.三次元データから,物体の位置,方向など二次元画像では取得しづらかった情報が得られるようになり,画像処理で可能な技術が広がっています.


三次元画像をもとに,プロジェクターの影を生成してしまう障害物(オクルーダー)を発見し,別のプロジェクターで影の部分を補完しています.さらにオクルーダーに投影されてしまう画像を消しています.


三次元画像から3Dモデルを再構成すると,点群のデータに隙間ができてしまうが,平面検出により点群でデータの隙間を補間しよりスムーズなモデルを得ることができます.


温度カメラとデプスカメラを複合して用いることによって,物体の三次元的な温度モデルを取得することができるようになります.このように,最新のデバイスによって新たな分野へ画像処理を適応することができます.


自己位置推定と環境地図作成を同時に行うSLAM(Simultaneous Localization and Mapping)という技術によって,未知の環境でもカメラの軌跡を正確にトラッキングすることができます.
その精度を競うトラッキングコンペティションという大会では,大会に向けて改良したSLAMシステムを用いて,優勝することができました.

斎藤研では様々なスポーツを対象とした画像処理を行っています.
アスリートの練習に役立つような研究や,スポーツをより臨場感を持って観戦するための研究を取り扱っています. 自分が高校時代や大学時代に行っていたスポーツをテーマにして研究を行っている人も多く,身近なところから研究を始めることができるかも!


手ブレの激しい映像から,ボートを自動検出し中央にボートが写るように動画の編集を行うビデオスタビライゼーションの研究を行っています.


マルチカメラを用いてスポーツシーンの3次元復元を行い,自由な視点でスポーツ観戦を可能にするための研究です.


マルチカメラを用いて卓球のボールの軌跡を再現を行い,アスリートの練習などに役立つ研究を行っています.

人物や特定物体の検出や追跡,認識などを行っています.
監視カメラ映像やスマートフォン等を入力として,現代社会で役立つような画像認識の研究を扱っています.
デジカメなどに用いられる顔検出などの学習アルゴリズムなどを勉強することができます.


Diminished reality (DR) research aims to develop methods to visually hide objects from real scenes. One or more cameras capture a scene where some objects, called the occluding objects, are ‘diminished’ by an DR system. To do this in real time we need to use multiple cameras. We introduce a novel multi-camera DR system utilizing an RGB-D camera to hide arbitrary trackable objects from a scene. In our case, the scene background does not have to be planar for the system to work and we can handle scene changes in real time. Additonally, we introduce color correction technique to merge image content originating from different cameras and also demonstrate method to repair images with partially missing content.


全方位カメラを用いた部屋の監視映像から,人物の検出と追跡を行い平面図に人物位置の描画を行います.


登山中に撮影した写真から高山帯・亜高山帯の判別を行い,登山に用いる高山帯マップの作成を行います.


様々な角度から撮られた車の写真から,車種の判別を行う研究です.