法国东谈主工智能初创公司Mistral发布了首款可处理图像和文本的模子。该模子名为 Pixtral 12B,领有 120 亿个参数,大小约为 24GB。参数粗心非常于模子处置问题的才气www.henhenlu.com,参数越多的模子频繁比参数越少的模子性能越好。
新模子缔造在 Mistral 的文本模子 Nemo 12B 上,不错回答对于自便数目、自便大小的图片的问题,这些图片不错是图片 URL,也不错是使用二进制文本编码决策 base64 编码的图片。与 Anthropic 的 Claude 系列和 OpenAI 的 GPT-4o 等其他多模态模子相同,Pixtral 12B 至少在表面上不错完成为图片添加标题和野心像片中物体数目等任务。
Pixtral 12B 可通过GitHub和东谈主工智能与机器学习劝诱平台Hugging Face 上的 torrent 纠合下载、微调www.henhenlu.com,并字据 Mistral 的圭表许可使用。
缺憾的是,在本文发表时,还莫得任何可用的网罗演示。Mistral 劝诱者干系垄断 Sophia Yang 在 X 上发表著作称,Pixtral 12B 将很快在 Mistral 的聊天机器东谈主和 API 管事平台 Le Chat 和 Le Platforme 上进行测试。
当今还不了了 Mistral 可能使用了哪些图像数据来劝诱 Pixtral 12B。
经典三级大多数生成式东谈主工智能模子,包括 Mistral 的其他模子,皆是在网罗上的大皆全球数据上磨真金不怕火出来的,而这些数据频繁皆是受版权保护的。一些模子供应商辩称,"合理使用"权使他们有权汇聚任何全球数据,但好多版权扫数者不快乐,并已对 OpenAI 和 Midjourney 等大型供应商拿告状讼,以阻截这种作念法。
Pixtral 120 亿好意思元的融资是在 Mistral 得到由 General Catalyst 领投的 6.45 亿好意思元融资之后进行的www.henhenlu.com,该轮融资使该公司估值达到 60 亿好意思元。刚刚缔造一年多的 Mistral 被东谈主工智能界的好多东谈主视为欧洲对 OpenAI 的回话。迄今适度,这家年青公司的计谋包括发布免费的"怒放"模子,对这些模子的托管版块收费,以及为企业客户提供推断管事。