banner

소식

May 22, 2023

Roll은 생성 AI를 사용하여 돌리 샷 등을 재현하고 싶어합니다.

최근까지 Box의 제품 관리 부사장이었던 Faizan Buzdar에 대해 잘 아는 사람들은 이 기업가를 뉴스룸(이 플랫폼 포함)에서 인기 있는 디지털 작업 공간 플랫폼인 Convo와 연관시킬 가능성이 높습니다. 그러나 전자 공학을 전공한 Buzdar는 오랫동안 비디오와 시각 효과에 매료되어 왔습니다.

Buzdar는 이메일을 통해 "평생 비디오 및 사진 애호가로서 수년간 비디오를 직접 제작해 왔지만 최근 수십 년 동안 혁신이 거의 없이 비디오 제작이 대부분 수동으로 유지되고 있다는 사실을 알게 되었습니다."라고 Buzdar는 말했습니다. . "한편, 지난 몇 년 동안 iPhone 카메라와 센서 기술이 단계적으로 개선되어 이미지 품질이 DSLR과 거의 동일해졌음을 확인했습니다."

그래서 Box에 있는 동안 Buzdar는 비디오 캡처 및 편집 경험을 개선하기 위해 AI 및 기계 학습의 혁신과 점점 더 인기 있는 매체인 비디오를 결합하기로 결정했다고 말합니다. Buzdar는 Twitter에서 사이트의 라이브 스트리밍 기능을 지원하는 인프라에 기여한 비디오 엔지니어인 Adeel Abbas와 Saj Khan, Fahad Yaqub 및 동료 Box 임원인 Michelle Oh를 만나 기술 가속 비디오 제작의 개척지를 탐구했습니다.

롤은 결과입니다. iOS용 새로운 앱인 이 앱은 보케, 멀티캠 샷, 모션 그래픽, 그리고 아마도 가장 흥미로울 것 같은 "AI 시뮬레이션" 슬라이더, 돌리 및 지브를 제공합니다.

이미지 크레딧:

Buzdar는 "우리의 임무는 고품질 비디오 제작의 세계를 뒤흔들어 비디오 콘텐츠 제작의 새로운 표준이 되는 것입니다"라고 말했습니다. "훌륭한 비디오를 제작하려면 장비, 장비, 해당 장비 사용 방법 학습, 편집용 소프트웨어에 대한 막대한 초기 투자가 필요합니다. 우리는 그런 모든 것을 없애고 있습니다."

"프로슈머" 시장(인플루언서 및 팟캐스터뿐만 아니라 자체 마케팅 자료를 만드는 기업도 생각해 보세요)을 겨냥한 Roll은 Roll iPhone 앱과 웹 앱이라는 두 가지 제품으로 구성됩니다. iPhone 앱은 비디오를 캡처하고 녹화한 다음 저장 및 처리를 위해 Roll의 클라우드에 자동으로 업로드합니다. 한편 웹 앱은 콘텐츠 제작자 한 명 또는 팀이 영상을 미리 보고, 액세스하고, 공유하고, 다운로드하고, 편집할 수 있는 곳입니다.

물론 비디오 앱은 아주 저렴합니다. 그렇다면 롤이 다른 점은 무엇입니까? 우선, 이 앱은 원격 비디오 인터뷰, 비디오 팟캐스트, 고객 추천서 등 대부분의 카메라 앱이 아닌 사용 사례를 목표로 한다고 Buzdar는 말합니다. Zoom, Microsoft Teams 및 Google Meet은 어느 정도 요구를 충족시키지만 Buzdar는 "고품질" 비디오 제작을 위해 설계되지 않았다고 주장합니다.

Roll은 또한 대부분의 비디오 캡처 앱보다 더 넓은 범위의 포스트 프로덕션 선택 사항을 제공하기 위해 다양한 실시간 효과를 사용합니다. 예를 들어 Roll은 HEVC 표준으로 녹화하여 동일한 파일 크기에 대해 대략 두 배의 비트 전송률과 더 높은 이미지 품질을 제공합니다. 그리고 Roll은 최대 2개의 카메라 샷(광각 샷과 클로즈업 샷)을 한 번에 녹화하고 처리할 수 있으므로 사용자는 효과적인 "멀티 카메라" 관점의 비디오를 만들 수 있습니다.

롤 편집 인터페이스.이미지 크레딧:

물론, 멀티캠은 특별히 독특하지는 않습니다. 롤은 멀티캠을 제공하는 최초의 앱과는 거리가 멀습니다. 그러나 Buzdar는 마법이 있는 곳은 후처리에 있다고 말합니다. Roll은 생성 AI를 활용하여 3D 공간에서 방을 재현하므로 콘텐츠 제작자는 비디오 게임과 같은 가상 카메라를 움직여 돌리나 크레인을 사용하여 좌우로 이동하는 것과 같은 움직임을 시뮬레이션할 수 있습니다.

Buzdar는 "오늘날 생성 AI는 허공에서 가짜 콘텐츠를 만드는 것과 너무 자주 연관되어 있습니다."라고 말했습니다. "그것은 우리의 철학이 아닙니다. 우리는 가짜 픽셀, 사람 또는 장면을 생성하지 않습니다. 우리는 생성 AI를 순전히 생산성을 위한 도구로 사용하고 있습니다. 우리는 더 높은 품질의 비디오 제작에 대한 접근을 민주화하고 싶습니다."

Buzdar는 Roll의 AI가 방에 앉아 있는 사람과 관계없이 깊이와 모양을 측정하는 데이터를 사용하여 장면의 3D 깊이를 이해하도록 훈련되었다고 설명했습니다. Roll은 학계에서 벤치마킹에 일반적으로 사용되는 오픈 소스 데이터 세트를 사용하여 알고리즘 교육을 시작했지만 내부적으로 22,000개 이상의 화상 통화를 녹음하여 풍부한 자체 데이터베이스를 만들었습니다.

공유하다