Break-A-Scene是一种新型的图像处理技术,能从单一图像中提取多个概念。通过使用自然语言引导和特定的训练策略,该技术可以重新合成各种场景中的单个或多个概念。
人工智能
-
-
NaturalSpeech 2是一种新型的人工智能技术,它利用潜在扩散模型,实现了自然且零射程的语音和歌唱合成。这项技术的出现,将为人工智能语音合成领域带来革命性的变化。
-
Google研究的Med-PaLM 2是一个专门为医疗领域设计的大语言模型,它在医疗许可考试样题上的表现达到了“专家”级别。Med-PaLM 2不仅能理解和解答文本问题,还能处理和理解医疗影像等多模态 …
-
斯坦福大学的研究人员利用人工智能提出了一种新的方法,通过动态调整道路收费来缓解交通拥堵。这种方法基于驾驶员行为来优化收费,有望改善全球多个城市的交通拥堵问题。
-
新加坡的初创公司Entoverse正在尝试将GPT智能集成到其Entograte ERP系统中,以优化工业昆虫养殖。该系统将帮助解决昆虫养殖中的常见问题,如环境条件和昆虫饲料引起的死亡和疾病,以及管理 …
-
Auto-GPT,一款基于先进的GPT-4语言模型构建的开源应用,近期在科技界引起了热烈的讨论。然而,这个项目在追求生产准备过程中面临着一些限制和挑战。本文将深入探讨这些问题,包括高昂的成本、开发与生 …
-
Falcon-40B是由TII开发的一款具有40B参数的因果解码器模型,训练数据基于1000B的RefinedWeb令牌。该模型优化了推理架构,具有开源领域最强大的性能,且可商业使用。
-
Relightify是一种新型技术,通过扩散模型从单张图像重建可重新照明的3D人脸。该技术利用高质量的UV纹理数据集和相应的面部反射图,通过在单一的去噪步骤序列中,不仅填充自遮蔽区域,还预测未知的反射 …
-
Colossal-AI是一个创新的深度学习系统,旨在使大规模并行训练更加高效和易用。它支持数据、流水线、张量和序列并行训练方法,以及与零冗余优化器集成的异构训练方法。相比于基线系统,Colossal- …
-
机器人指南网站重新上线,提供了近250种机器人的详细信息,包括照片、视频、技术规格等,同时还有科幻机器人对战游戏供用户体验。