Vés al contingut

Mistral AI

De la Viquipèdia, l'enciclopèdia lliure
Infotaula d'organitzacióMistral AI
Dades
Tipusorganització Modifica el valor a Wikidata
Indústriacombined administrative office services (en) Tradueix Modifica el valor a Wikidata
Camp de treballintel·ligència artificial Modifica el valor a Wikidata
Forma jurídicasocietat per accions simplificades Modifica el valor a Wikidata
Història
Creació28 abril 2023
FundadorGuillaume Lample (en) Tradueix, Timothée Lacroix (en) Tradueix i Arthur Mensch (en) Tradueix Modifica el valor a Wikidata
Governança corporativa
Seu
Executiu en capArthur Mensch (en) Tradueix (2023–) Modifica el valor a Wikidata

Lloc webmistral.ai Modifica el valor a Wikidata
Twitter (X): MistralAI LinkedIn: mistralai Modifica el valor a Wikidata

Mistral AI és una empresa francesa que ven productes d'intel·ligència artificial (IA). Va ser fundada l'abril de 2023 per empleats anteriors de Meta Platforms i Google DeepMind. La companyia va recaptar 385 milions d'euros l'octubre de 2023 i el desembre de 2023 estava valorada en més de 2.000 milions de dòlars.[1][2][3]

Produeix grans models de llenguatge de codi obert, [4] citant la importància fonamental del programari de codi obert, i com a resposta als models propietaris.[5]

A partir de març de 2024, s'han publicat dos models i estan disponibles com a pesos.[6] Tres models més, petit, mitjà i gran, només estan disponibles mitjançant l'API.[7][8]

Història[modifica]

Mistral AI va ser cofundada l'abril de 2023 per Arthur Mensch, Guillaume Lampe i Timothée Lacroix. Abans de cofundar Mistral AI, Arthur Mensch va treballar a Google DeepMind, que és el laboratori d'intel·ligència artificial de Google, mentre que Guillaume Lample i Timothée Lacroix van treballar a Meta Platforms. Els cofundadors es van conèixer mentre estudiants de l'École polytechnique. Mistral rep el nom d'un fort vent que bufa a França.

El juny de 2023, l'start-up va dur a terme una primera recaptació de fons de 105 milions d'euros (117 milions de dòlars) amb inversors com el fons nord-americà Lightspeed Venture Partners, Eric Schmidt, Xavier Niel i JCDecaux. El Financial Times estima que la valoració és de 240 milions d'euros (267 milions de dòlars).

El 27 de setembre de 2023, l'empresa va posar a disposició el seu model de processament d'idioma "Mistral 7B" sota la llicència gratuïta d'Apache 2.0. Aquest model té 7.000 milions de paràmetres, una mida petita en comparació amb els seus competidors.

El 10 de desembre de 2023, Mistral AI va anunciar que havia recaptat 385 milions d'euros (428 milions de dòlars) com a part de la seva segona recaptació de fons. En aquesta ronda de finançament participen sobretot el fons californià Andreessen Horowitz, BNP Paribas i l'editor de programari Salesforce.[9]

L'11 de desembre de 2023, la companyia va llançar el model "Mixtral 8x7B" amb 46.700 milions de paràmetres però utilitzant només 12.900 milions per testimoni gràcies a la barreja d'arquitectura d'experts. El model domina 5 idiomes (francès, espanyol, italià, anglès i alemany) i supera, segons les proves dels seus desenvolupadors, el model "Llama 2 70B" de Meta. També s'ofereix una versió entrenada per seguir instruccions i anomenada "Mixtral 8x7B Instruct".[10]

El 26 de febrer de 2024, Microsoft va anunciar una nova associació amb la companyia per ampliar la seva presència a la indústria de la intel·ligència artificial en ràpida evolució. Segons l'acord, els models lingüístics rics de Mistral estaran disponibles al núvol Azure de Microsoft, mentre que l'assistent de conversa multilingüe "Le Chat" es llançarà a l'estil de ChatGPT.[11]

Models[modifica]

Models de pes obert[modifica]

Mistral 7B[modifica]

Mistral 7B és un model de llenguatge de paràmetres 7.3B que utilitza l'arquitectura de transformadors. Publicat oficialment el 27 de setembre de 2023, mitjançant un enllaç imant BitTorrent, [12] i Hugging Face.[13] El model es va publicar sota la llicència Apache 2.0. La publicació del bloc de llançament va afirmar que el model supera el LLaMA 2 13B en tots els punts de referència provats i està a l'altura del LLaMA 34B en molts punts de referència provats.[14]

Mixtral 8x7B[modifica]

Igual que el primer model de Mistral, Mixtral 8x7B es va llançar a través de BitTorrent el 9 de desembre de 2023, [4] i més tard es van publicar Hugging Face i una publicació al bloc dos dies després.[10]

A diferència del model Mistral anterior, Mixtral 8x7B utilitza una barreja escassa d'arquitectura experta. El model té 8 grups diferents d'"experts", donant al model un total de 46,7B paràmetres utilitzables.[15][16] Cada testimoni només pot utilitzar 12.9B paràmetres, per tant, proporcionant la velocitat i el cost que suposaria un model de paràmetres de 12.9B.[10]

Models només API[modifica]

Mistral Large[modifica]

Mistral Large es va llançar el 26 de febrer de 2024 i Mistral afirma que és el segon al món només després del GPT-4 d'OpenAI.

Parla anglès, francès, espanyol, alemany i italià amb fluïdesa, i Mistral afirma que entén tant la gramàtica com el context cultural, i ofereix capacitats de codificació. A principis de 2024, és la IA insígnia de Mistral.[17] També està disponible a Microsoft Azure.

Mistral Petit[modifica]

Igual que el model Large, Small es va llançar el 26 de febrer de 2024. Està pensat per ser un model lleuger per a una baixa latència, amb un millor rendiment que el Mixtral 8x7B.[17]

Referències[modifica]

  1. Fink, Charlie. «This Week In XR: Epic Triumphs Over Google, Mistral AI Raises $415 Million, $56.5 Million For Essential AI» (en anglès). Forbes. [Consulta: 16 desembre 2023].
  2. «A French AI start-up may have commenced an AI revolution, silently» (en anglès). Hindustan Times, December 12, 2023.
  3. «French AI start-up Mistral secures €2bn valuation» (en anglès). ft.com Financial Times.
  4. 4,0 4,1 «Buzzy Startup Just Dumps AI Model That Beats GPT-3.5 Into a Torrent Link» (en anglès). Gizmodo, 12-12-2023. [Consulta: 16 desembre 2023].
  5. «Bringing open AI models to the frontier» (en anglès americà). Mistral AI, 27-09-2023. [Consulta: 4 gener 2024].
  6. «Open-weight models and Mistral AI Large Language Models» (en anglès). docs.mistral.ai. [Consulta: 4 gener 2024].
  7. «Endpoints and Mistral AI Large Language Models» (en anglès). docs.mistral.ai.
  8. «Endpoints and benchmarks | Mistral AI Large Language Models» (en anglès). docs.mistral.ai. [Consulta: 6 març 2024].
  9. «Mistral lève 385 M€ et devient une licorne française - le Monde Informatique» (en anglès), 11 December 2023.
  10. 10,0 10,1 10,2 «Mixtral of experts» (en anglès americà). mistral.ai, 11-12-2023. [Consulta: 4 gener 2024].
  11. Bableshwar. «Mistral Large, Mistral AI's flagship LLM, debuts on Azure AI Models-as-a-Service» (en anglès). techcommunity.microsoft.com, 26-02-2024. [Consulta: 26 febrer 2024].
  12. Goldman, Sharon. «Mistral AI bucks release trend by dropping torrent link to new open source LLM» (en anglès americà). VentureBeat, 08-12-2023. [Consulta: 4 gener 2024].
  13. Coldewey, Devin. «Mistral AI makes its first large language model free for everyone» (en anglès). TechCrunch, 27-09-2023. [Consulta: 4 gener 2024].
  14. «Mistral 7B» (en anglès americà). mistral.ai. Mistral AI, 27-09-2023. [Consulta: 4 gener 2024].
  15. «Mixture of Experts Explained» (en anglès). huggingface.co. [Consulta: 4 gener 2024].
  16. Marie, Benjamin. «Mixtral-8x7B: Understanding and Running the Sparse Mixture of Experts» (en anglès). Medium, 15-12-2023. [Consulta: 4 gener 2024].
  17. 17,0 17,1 AI, Mistral. «Au Large» (en anglès americà). mistral.ai, 26-02-2024. [Consulta: 6 març 2024].