人工智能归档

AIBackup2023-05-240569 views

Text2NeRF是一种新型的文本驱动的3D场景生成框架，它结合了神经辐射场（NeRF）和预训练的文本到图像扩散模型，从自然语言描述中生成多样化的、视角一致的室内和室外3D场景。

AIBackup2023-05-240145 views

Facebook AI研究团队推出了一项新的多语言语音识别和语音合成技术，支持1100多种语言。这项技术基于大规模多语言语音（MMS）项目，利用公开可用的宗教文本进行自我监督学习，实现了语音到文本、文本到语音以及语言识别等功能。这一突破将为全球更多语言使用者提供信息获取的便利。

AIBackup2023-05-230197 views

Mind-Video是一项新的研究，旨在通过大脑活动重构人类视觉体验。这项工作填补了图像和视频大脑解码之间的空白，通过两个模块的管道设计，从大脑信号中逐步学习，深入理解语义空间。

AIBackup2023-05-230134 views

了解可组合扩散（CoDi）生成模型，能够从任意组合的输入模态生成任意组合的输出模态，包括图像、视频、音频和文本等，适用于联合模态生成。了解更多信息请点击。

AIBackup2023-05-220252 views

Langchain推出了一种新的方式，让用户能够通过其代理与Spark SQL进行交互。这种新的方法不仅可以解答关于Spark SQL的一般查询，还可以帮助用户恢复错误。

AIBackup2023-05-210230 views

PrivateGPT是一种全新的本地化问答系统，允许用户在没有互联网连接的情况下，使用GPT的强大功能与文档进行交互。这个系统100%私有，没有任何数据泄露的风险。