Apple rilascia alcuni modelli di IA open source

Apple rilascia alcuni modelli di IA open source

In vista di iOS 18, e delle sue capacità di elaborazione grazie all’intelligenza artificiale, Apple ha rilasciato alcuni set di modelli di IA in formato open source.

Si chiamano OpenELM, e vengono descritti come Open-Source Efficient Language Models, ossia modelli di linguaggio che offrono caratteristiche e performance simili agli altri modelli, ma con più efficienza e meno necessità di dati di training.

Dalla spiegazione di Apple si evince che OpenELM è un modello di linguaggio avanzato e open source, ed impiega una strategia di scalatura per ciascun livello del modello transformer, che permette di distribuire efficacemente i parametri all’interno di ogni livello, migliorando così l’accuratezza del modello. Ad esempio, con circa un miliardo di parametri, OpenELM ha mostrato un miglioramento dell’accuratezza del 2,36% rispetto a OLMo, pur richiedendo la metà dei token necessari per il pre-training.

Qualunque cosa voglia dire, pare che queste siano le basi sulle quali funzionerà iOS 18, che vediamo l’ora di vedere in azione.

Per chi ne capisce di più, vi lasciamo i link per approfondire il tutto:

OpenELM: An Efficient Language Model Family with Open-source Training and Inference Framework

OpenELM database su Hugging Face

via

+1
0
+1
0
+1
0
+1
0
+1
0
+1
0
+1
0

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *