首页 » 【Falcon-40B】:开源领域最强大的人工智能语言模型

【Falcon-40B】:开源领域最强大的人工智能语言模型

by AIBackup

Falcon-40B是由TII开发并在Hugging Face平台上发布的一款开源人工智能语言模型。该模型具有40B参数,是目前开源领域中最强大的模型之一。Falcon-40B在许多方面超越了LLaMA、StableLM、RedPajama、MPT等模型,具有优化的推理架构,包括FlashAttention(Dao等人,2022)和multiquery(Shazeer等人,2019)。

Falcon-40B的训练数据基于1000B的RefinedWeb令牌,这是一个高质量的过滤和去重的网络数据集,我们用精选的语料库进行了增强。该模型在Apache 2.0许可下提供,允许商业使用,无需任何版税或限制(100万美金以上需细看限制条约)。

值得注意的是,Falcon-40B是一个原始的预训练模型,对于大多数用例,都应该进行进一步的微调。如果您正在寻找更适合以聊天格式接受通用指令的版本,我们建议查看Falcon-40B-Instruct。

Falcon-40B支持多种语言,包括英语、德语、西班牙语、法语,并在意大利语、葡萄牙语、波兰语、荷兰语、罗马尼亚语、捷克语、瑞典语等语言中具有有限的能力。

更多信息请查看相关资料:Falcon-40B on Hugging Face

也许你还会喜欢