OpenAI推出声音克隆新技术:复刻你的声音仅需15秒
据媒体报道,OpenAI公司最近推出了一项革命性的声音克隆技术——“Voice Engine”。
据悉,Voice Engine通过文本输入和15秒的音频样本,便能生成与原始说话者声音极为相似、情感丰富且自然逼真的语音。
这一技术的研发始于2022年,并已应用于公司现有的文本转语音API和Read Aloud功能中的预设语音。
OpenAI认为,Voice Engine技术对于多个领域具有重大意义。在阅读辅助和语言翻译方面,它能够提供更为自然的语音输出,增强用户体验。
同时,该技术对于言语障碍患者来说更是一大福音,能够帮助他们更顺畅地交流。例如,在布朗大学的一个试点项目中,该技术成功用于创建从学校项目录制的音频中提取的语音克隆,有效帮助了言语障碍学生。
然而,鉴于合成语音技术可能存在的滥用风险,OpenAI目前仅对少数可信合作伙伴开放小规模测试。通过这种方式,公司旨在深入了解技术的潜在应用,并评估可能带来的风险。
OpenAI也希望通过此举引发社会对合成语音负责任部署的广泛讨论,共同探索如何适应这一新型技术。
此外,为了确保技术的安全使用,OpenAI还采取了一系列安全措施。这些措施包括使用水印技术追踪音频来源,以及对系统的使用方式进行主动监控。
当产品正式推向市场时,公司将设立一个“禁止语音列表”,以检测并阻止与名人声音过于相似的人工智能生成声音,从而避免潜在的版权和隐私问题。
-
OpenAI宣布将o3模型调用价格下调80% 每百万输出从40美元降低至8美元
2025 年 4 月 OpenAI 发布推理模型 o3,该模型在多种基准测试中都取得最佳成绩,模型还支持使用外部工具例如网页浏览和使用 Python 解释器等。尽管该模型在性能上表现不俗但 API 调
-
OpenAI推出旗舰推理模型o3-pro 在各方面全面提升且表现优异 附API价格
OpenAI 日前发布该公司推理模型中的新成员 o3-pro,该模型可以利用更多计算资源进行更加深入地思考并持续提供更加精准的回答。o3-pro 在数学、科学和编程方面的表现都非常优异,因此 Open
-
挑战高考数学卷,DeepSeek-R1、腾讯混元T1、Grok 3等十大模型测评来了
2025年高考大幕虽已落下,但关于数学科目难度的讨论热度不减。 《每日经济新闻》记者(以下简称“每经记者”)选取今年的全国新课标数学I卷作为考题,对DeepSeek-R1、腾讯元宝(混元T1)、Ope
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

随时掌握互联网精彩
- 英伟达市值超越微软 重回全球第一
- iPhone 17系列重磅升级:全系LTPO高刷屏 尺寸增大
- 美团收银 v2.5.1最新版本2022下载地址
- 加币兑换人民币汇率2023年12月12日
- 微充 v1.1.1最新版本2022下载地址
- ArtIcons 专业版 4.14.0.137最新版本2022下载地址
- 高速免费2023年时间最新规定
- 知云文献翻译 7.7.2最新版本2022下载地址
- 《黑暗荣耀》宋慧乔疯妈是朴智娥
- Send to Kindle for PC 1.1.1.250最新版本2022下载地址
- 必应词典 3.5.3.1600最新版本2022下载地址
- 音壳视唱练耳 v5.5.1最新版本2022下载地址