查看: 89|回复: 0

[其他] NVIDIA Maxine 开发者平台将改变价值 100 亿美元的视频会议行业

[复制链接]

1

听众

0

收听

0

好友

儒士

Rank: 4

UID
170746
积分
243
回帖
235
主题
6
铜币
756
威望
122
银币
0
贡献
0
发书数
0
注册时间
2024-2-27
最后登录
2024-4-26
在线时间
23 小时
QQ
发表于 2024-3-28 14:27 | 显示全部楼层 |阅读模式
视频会议使许多人能够在任何地方保持高效工作。
现在,NVIDIA 正在帮助价值 100 亿美元的行业内的视频会议、呼叫中心和流媒体应用程序开发人员轻松地将 AI 集成到他们的工作流程中,从而提高他们的工作效率。
新版本的 Maxine AI 开发者平台改变了最先进的实时视频会议应用程序的创建方式,其功能可增强用户的灵活性、参与度和效率。
Maxine通过NVIDIA AI Enterprise软件平台提供,允许开发人员利用最新的 AI 驱动功能(例如增强的视频和音频质量以及增强现实效果),将用户的日常视频通话转变为引人入胜的协作体验。
使用新 Maxine 功能扩展视频会议
Maxine AI 开发者平台使开发人员能够轻松访问和集成实时的 AI 增强功能,从而提高视频会议用户的参与质量。
降噪、视频去噪和放大以及工作室语音等功能可提高音频和视频流的质量。借助眼动校正、实时肖像等先进功能以及视频重新照明和云微服务 Maxine 3D 等未来功能,开发人员可以增强视频会议参与度和个人联系。
该平台扩展了最先进的人工智能模型在音频、视频和增强现实效果方面的实用性,为开发人员提供多种方式来提供 Maxine 功能,包括软件开发套件、微服务,甚至应用程序编程接口 (API)从 NVIDIA 的云基础设施交付的端点。
Maxine 生产功能现已提供更新,包括:
  • 眼神接触:改进的眼神接触模型通过自然的眼球运动提供凝视重定向,从而实现更深层次的会议参与者参与。
  • 语音字体:这种新模型将说话者的声音与目标声音相匹配,同时保持语言信息和韵律(节奏和语气)不变。
  • 背景降噪 (BNR) 2.0:该模型更新了人类听力和语言编码的降噪功能,特别致力于降低编码单词错误率。
今年春季抢先体验的新功能包括:
  • 语音实时肖像:此模型允许用户通过直接语音或任何音频源驱动肖像,使用户在电话会议期间始终保持最佳状态。
  • 录音室语音:此型号使普通耳机、笔记本电脑和台式麦克风能够提供高端录音室麦克风的声音,让用户在电话会议期间始终保持最佳声音。
Maxine早期访问计划共享即将推出的功能的预生产和预发布版本,以便从开发人员那里获得有关 Maxine 模型的实用性和改进的反馈。在此版本中,我们要求开发人员提供有关开发流程早期功能的反馈,包括:
  • Maxine 3D:之前在 SIGGRAPH 2023 上作为研究演示进行展示,该云微服务通过实时 NeRF 技术将 2D 视频提升为 3D,为视频会议提供了新的参与水平。
  • 视频重新照明:这种新模型使用高动态范围图像来照亮用户,从而实现用户照明与各种背景图像的无缝匹配。
  • API 端点:API 端点为开发人员提供了通过 NVIDIA 云基础设施访问 Maxine 功能的灵活性,使 Maxine 集成变得更加容易。
Jugo 和阿森纳足球俱乐部取得重要进球
体育赛事是人类的终极体验,超越国界和语言障碍将团队和球迷团结在一起。Jugo使用 Maxine 的 AI Green Screen 功能,为虚拟活动提供了一个数字平台,使公司能够使用虚幻引擎创建身临其境的体验,将来自世界各地的粉丝聚集在一起,而无需使用完整的制作工作室。
英格兰超级联赛的一支劲旅阿森纳足球俱乐部正在与 Jugo 合作,彻底改变足球俱乐部与其全球 6 亿球迷的互动方式。此次合作提供了新的虚拟体育娱乐体验,以提高全球支持者的参与度。 Jugo 将真实的人际互动的力量带入阿森纳的赛事中,在支持者和俱乐部的体育英雄之间建立现实的虚拟联系。
Jugo Experience 首席执行官 Richard Stirk 表示:“Jugo Experience 平台正在改变品牌市场,以追求全球知名度和参与度。” “阿森纳足球俱乐部是全球品牌延伸的完美典范。创建沉浸式品牌体验的灵活性是 Jugo 产品的关键,而 Maxine AI 开发者平台是这种灵活性的基本构建模块。”
Jugo 也是 针对尖端初创公司的NVIDIA Inception计划的成员。
树立人工智能增强视频会议新标准
GemeloPexipSpectacleVideoRequest是首批利用抢先体验计划中的最新功能,利用商用摄像机和麦克风创建专业视听工作室的客户。
Gemelo 首席执行官 Paul Jaski 表示:“Gemelo 多年来一直参与 Maxine 模型预发布版本的测试,我们非常重视在 Maxine 功能开发过程中提供早期意见的机会。” “最新功能语音实时肖像将为我们的客户提供更大的灵活性来创建定制视频消息,打开个性化新时代的大门。”
Pexip 首席技术官 Ian Mortimer 表示:“Pexip 欢迎有机会测试 Maxine 功能的开发版本,并帮助指导最终产品模型。” “在测试最新版本的 Maxine BNR 时,我们发现清晰度和语音质量有了显着改善,并计划继续完善我们的测试参数,以帮助优化 AI 翻译管道的准确性。”
Spectacle 总裁 Benjamin Portman 表示:“NVIDIA Maxine Eye Contact API 显着简化了我们为 Spectacle 应用程序用户提供引人入胜的视频处理功能的过程,让我们无需担心基础设施和资源密集型集成。” “有了它,我们能够在几天内创建概念验证,从而加快了我们的生产应用程序部署时间。”
VideoRequest 首席技术官 Joe Tyler 表示:“我们对 Maxine Studio Voice 的早期测试让我们对人工智能增强型制作和视频推荐的可能性有了一个令人印象深刻的了解。” “新的 Maxine BNR 和 Eye Contact 功能将帮助我们的客户克服具有挑战性的录制环境,从而提高视频质量。”

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|阡陌居

GMT+8, 2024-4-28 08:51 , Processed in 0.035595 second(s), 23 queries .

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表