MLBも注目するボリュメトリックビデオ、新たな映像体験を開拓するキヤノン:スポーツ観戦から文化継承まで──3D映像が変える“体験のデジタル化”

MLB開幕戦で世界が驚いた「自由視点映像」 3月のMLB開幕シリーズでのロサンゼルス・ドジャース対シカゴ・カブス戦、大谷翔平選手のホームランのリプレイで使われた自由視点映像を米メディア「FOX Sports」がXで紹介するや、ソーシャルで話題になった。自由視点映像により、大谷選手のバットにボールが当たったところから、カメラはピッチャー後ろからゆっくりと大谷選手の横へとアングルを移し、最終的にホームベース側から打球を見送る視点に切り替わった。 開幕戦ではまた、カブス対巨人で外野選手のファインプレーのリプレイも注目を集めた。リプレイの自由視点映像はファインプレーの動きを選手の後ろから追った後、中継では映っていない選手のガッツポーズもとらえていた。 この自由視点映像技術を実現しているのは「ボリュメトリックビデオ」という映像技術だ。東京ドームでは2023年よりキヤノン製のボリュメトリックビデオシステムを本格的に導入しており、現在は読売ジャイアンツのホームゲームで活用されている。日本テレビの中継でもお馴染みだが、米国の視聴者の目には新鮮に映ったようだ。 カメラ125台で捉えた画像から立体映像を構築 ボリュメトリックビデオは、空間を多数のカメラで撮影し、2次元の撮影データから3次元データを作り出す技術だ。体積(=volume)情報を取得することから、Volumetric(ボリュメトリック)と言われる。あらゆる方向から撮影することで、空間を丸ごと記録蓄積することが可能になる。その後、色やテクスチャを貼りレンダリング処理を行う。人物など一部のデータは背景を切り分けて処理する。 複数のカメラ映像を瞬時に切り替えるという手法はすでに用いられているが、ボリュメトリックビデオは撮影した空間全体を3Dデータ化するため、好きなアングルから映像として再現できる。先述の自由視点映像のほか、3Dのフィギュアなどのアウトプットが可能になる。 東京ドームには現在、上部のキャットウォークやバックスクリーン下部などに125台の4Kカメラが設置されている。カメラは「EOS C300 Mark II」を改造したもので、60fpsでの撮影が可能だ。2022年に87台でスタートしたが、毎年台数を増やしてきた。 重要なのは、これら125台のカメラが正確に同期していることだ。カメラのカスタマイズにより1マイクロ秒以下の精度で同期撮影を実現している。これについて、キヤノン イメージング事業本部 IMG第三事業部 IMG32事業推進センター所長 藤井賢一氏は、「同時撮影は重要なポイント。マイクロ秒以下でカメラが同期して、一斉にシャッターを切っています」と説明する。 3秒へのこだわりの背景ーー実用化の転機となったラグビーW杯 ボリュメトリックビデオ生成のための一連の処理を、キヤノンはわずか3秒で完了させる。 この3秒のこだわりは、この技術を開発する過程で得た。これまでの歴史を紐解くと、キヤノンがボリュメトリックビデオ技術の開発を開始したのは2016年。「我々は静止画、一眼カメラを強みとしてきたが、これからは映像、それも3Dにも拡大しようという思いで開発がスタートした」と藤井氏。そこから、「これまでの中継では見られなかったようなシーンを含めて、自分の好きな視点で映像を見られるようにしたい」とアイディアが膨らんでいった。 そこで社内のカメラ、ハードウェア、画像処理、ネットワークの専門家を集めてプロジェクトチームを結成。初期はサッカーに着目して実験撮影を重ねた。藤井氏と同じくIMG32事業推進センターに所属する部長の神谷泰次氏は、「リアルタイム処理ができないため、撮ったデータを持ち帰り実験室で時間をかけて3Dのデータ化していました」と振り返る。 左がキヤノン イメージング事業本部 IMG第三事業部 IMG32事業推進センター所長 藤井賢一氏右が同 神谷泰次氏 CIO.com 転機となったのが2019年のラグビーワールドカップ日本大会だ。日産スタジアムに125台のカメラを設置し、決勝を含む6試合を撮影した。この時点では試合の1時間後にボリュメトリックビデオの映像ファイルを提供していたため、残念ながら中継では利用されなかった。しかし、ネット配信で公開された自由視点映像は大きな反響を呼んだ。 中継ですぐに配信されればもっと喜ばれるかもしれないーー目指したのは、放送で使用可能な時間である「3秒で生成」だ。そのために、アルゴリズム、ハードウェア、ソフトウェアなど多面的なアプローチで改善した。 「実は、技術的には”3秒で生成”は実現していました。ただし、自由視点映像にする効果的な試合シーンの選択、リプレイ視聴してもらいたいカメラアングルでの映像制作などに時間を要していたため、1時間後の映像ファイル提出となっていました。放送で使用可能になるために、3秒生成の基本を維持しつつ、高画質化、カメラアングル即時制作、中継とのワークフロー連携が必要でした」と神谷氏は詳細を説明する。 そうやって開発した現在のシステムは、エッジで3Dモデルの生成、そして3Dモデル化された映像データを土台にしたボリュメトリックビデオの生成処理を行う。高速な処理を実現する鍵は独自のハードウェア技術にある。カメラ近くに設置したハードウェアで前処理を行った後にデータをサーバーに送るが、AIを利用した3Dモデル生成に必要な一部の画像処理も行なっているという。ここは、クラウドで多数のサーバーで処理を行うアプローチとは大きく異なる点だ。 こうやって、放送可能なボリュメトリック映像を3秒で実現するに至った。「ボリュメトリックビデオは他社も手掛けているが、ここは我々の強み」と藤井氏は胸をはる。 エンタメから技術伝承まで広がる用途、将来は「ワンソース・マルチユース」を目指す ラグビーワールドカップで好評を得たことから、スポーツ用途ではNBA(National Basketball Association)が2021-2022シーズン、2022-2023シーズンで活用するなどのボリュメトリックビデオの事例が生まれている。スポーツ以外にも広がっており、能楽ではボリュメトリックビデオを使うことで役者の動きを立体的に見せる映像が仕上がった。 キヤノンは2020年、神奈川・川崎の事業所にボリュメトリックビデオの専用スタジオを用意した。撮影可能な範囲は8メートルx8メートル。それを、159台の専用カメラが囲む。バスケットなどのスポーツ、ミュージックビデオやファッションショーなどの撮影が行われている。コロナ禍では日本にいる空手の師範が海外の道場に型を配信するという新しい活用方法も生まれた。介護や寿司職人といった匠の技の伝承を目的とした撮影も増えているそうだ。新しいところでは、NHKの連続テレビ小説「あんぱん」のオープニング映像制作が行われた。 このように用途の広がりを感じているが、課題もある。現状で認知が高いとは言い難い技術をどう広げるか、そして起爆につながるキラーアプリケーションがまだ見えていないことだ。 藤井氏らはボリュメトリックビデオ撮影のための設備も課題にあげる。高品質な映像を実現するためには高性能なカメラを多数用意する必要がある。エッジでの処理のためにサーバーなどの機材も必要となり、操作をするオペレーターも配置しなければならない。そのような設備をスタジアムに設置・導入することは時間とコストがかかる。解決の道筋はこれからのようだ。 動画の時代、ボリュメトリックビデオをはじめとしたエッジコンピューティングにおける動画処理は増加が見込まれる。そして、この分野でもAIの影響は無視できない。 エッジITインフラを専門とするIDC Japan株式会社 Data & Analytics、 Enterprise Infrastructureリサーチマネージャーの下河邊雅行氏は、注目技術としてビジョンランゲージモデル(VLM)を挙げる。画像とテキストの両方を扱うAIモデルで、口語形式での映像の操作が可能になる。「VLMとボリュメトリックビデオの融合により、オペレーターの操作が飛躍的に容易になることが予想される」と話す。 ボリュメトリックビデオの認知度やキラーアプリケーションについては、「ラグビー、野球、バスケット以外の様々なスポーツで素晴らしい視聴体験をもたらすことができる。ボリュメトリックビデオを利用する側は「何ができるか」よりも「何がしたいか」の視点と熱い思いが重要。また、スポーツ団体以外のステークホルダーも巻き込んだマネタイズの仕組みづくりも必要だろう」と述べる。 なお、ボリュメトリックビデオはスポーツやエンタメなど既存の事例だけではなく、デジタルツイン環境におけるアバターなどビジネスでも活用の可能性は十分にあるという。「ボリュメトリックビデオが”ナイス・ツー・ハブ”(あればベター)から”マスト・ハブ”(なくてはならない)の技術になるためにはどうすればいいか、業界全体で取り組んでいく必要がある」(下河邊氏)。 キヤノンでは、次のステージとして「ワンソース・マルチユース」を定めている。「現在は配信する側が自由視点を操作するが、ユーザーが自由に操作できたらもっと楽しめるのではないか」と藤井氏。例えば野球であれば二塁手だけを追う、エンタメならグループの中の”推し”だけを見るといった楽しみ方が可能になる。そのためにはデータ容量の問題などの技術課題があり、目下パートナーとともに方法を探っているそうだ。 「視聴者が自由に映像を操作して見られる世界を実現したい。今までには味わえなかった体験を提供できれば、我々にとっても大きなマイルストーンになると考えています」(藤井氏)。 Read More from This Article: MLBも注目するボリュメトリックビデオ、新たな映像体験を開拓するキヤノン:スポーツ観戦から文化継承まで──3D映像が変える“体験のデジタル化” …

Vendor pricing experiments leave CIOs’ AI costs in flux

AI vendors are experimenting with pricing rates and models, creating cost uncertainty for enterprise CIOs deploying the technology, according to industry observers. While many AI vendors have moved to hybrid pricing models that combine subscriptions with use- or outcome-based pricing, these strategies are not set in stone, says Brian Clark, president of go-to-market initiatives at…

“금전 목적 넘어서는 중” 전문가들이 본 사이버 범죄의 최신 동기

사이버 범죄의 심각성은 흔히 숫자로 설명된다. 2025년까지 전 세계 피해 규모는 10조 5,000억 달러에 이를 것으로 전망된다. 사이버 범죄가 하나의 국가라면 미국과 중국에 이어 세계 3위 경제 규모에 가까운 액수다. 피싱, 가짜 웹사이트 등 온라인 사기만 하더라도 피해 금액은 약 1조 300억 달러에 달하는 것으로 나타났다. 최근에도 랜섬웨어와 대규모 조직을 겨냥한 금융 공격은 급증하고 있다.…

에이스 직원의 사표를 막아라! 핵심 인재를 붙잡는 7가지 전략

미국 내 기술 직종의 실업률은 2.9%로, 수년째 낮은 수준을 계속 보이고 있다. CIO들에 따르면 이 때문에 IT 인재 확보 경쟁은 치열하며, 특히 뛰어난 성과를 내는 인재를 둘러싼 경쟁은 더욱 심화되고 있다. 컨설팅 기업 퓨처럼그룹(Futurum Group)이 발표한 ‘2025년 2분기 글로벌 CIO 설문조사’에서는 CIO의 72%가 숙련 인재의 채용과 유지가 가장 큰 과제라고 답했다. HR 리서치 및 자문…

13개국 정보 기관, 중국 해커조직 ‘솔트 타이푼’ 확산 경고

광범위한 활동을 벌여온 중국 해커 조직 ‘솔트 타이푼(Salt Typhoon)’이 최근 네덜란드를 새로운 공격 대상으로 삼고 있다. 네덜란드 정보 당국은 솔트 타이푼이 소규모 인터넷 서비스 및 호스팅 사업자의 라우터에 접근한 사실을 확인했다고 밝혔다. 이 사실은 13개국 정보 기관이 고스트엠퍼러(GhostEmperor), 오퍼레이터 판다(Operator Panda), 레드마이크(RedMike) 등으로도 알려진 솔트 타이푼의 위험성에 대해 경고를 발령한 직후 확인됐다. 또한 이 그룹이…

MS, 첫 자체 개발 AI 모델 ‘MAI’ 공개··· “일부 코파일럿 서비스에 이미 탑재”

오픈AI 파운데이션 모델에 의존해 왔던 마이크로소프트(MS)가 자체 개발한 AI 모델을 공개하며 독자 노선을 강화하고 있다. 지난달 29일 MS AI 부문이 그간 업계의 추측을 모았던 자체 모델 MAI-보이스-1과 MAI-1 프리뷰를 공개했다. 두 모델은 사내에서 온전히 개발 및 훈련한 첫 모델로 알려졌다. MS에 따르면 MAI-보이스-1은 자연스러운 음성을 생성하는 모델로, 단일 GPU에서 1초 이내에 1분 길이 오디오를 생성할…

오픈AI, 실시간 음성 모델에 MCP·SIP 지원 추가···기업용 음성 에이전트 역량 강화

오픈AI가 음성-텍스트 변환 대규모 언어 모델 ‘gpt-realtime’에 원격 MCP(Model Context Protocol) SIP(Server and session Initiation Protocol) 지원을 추가했다. 전용 API를 통해 제공되는 이번 업데이트는 기업이 더욱 자율적인 음성 기반 에이전트를 구축할 수 있도록 돕는 것을 목표로 한다. 포레스터 부사장이자 수석 애널리스트인 찰리 다이는 “실시간 API에서 원격 MCP 서버 지원은 개발자가 인터넷이나 별도의 서버에 등록된 MCP…