In vista di iOS 18, e delle sue capacità di elaborazione grazie all’intelligenza artificiale, Apple ha rilasciato alcuni set di modelli di IA in formato open source.
Si chiamano OpenELM, e vengono descritti come Open-Source Efficient Language Models, ossia modelli di linguaggio che offrono caratteristiche e performance simili agli altri modelli, ma con più efficienza e meno necessità di dati di training.
Dalla spiegazione di Apple si evince che OpenELM è un modello di linguaggio avanzato e open source, ed impiega una strategia di scalatura per ciascun livello del modello transformer, che permette di distribuire efficacemente i parametri all’interno di ogni livello, migliorando così l’accuratezza del modello. Ad esempio, con circa un miliardo di parametri, OpenELM ha mostrato un miglioramento dell’accuratezza del 2,36% rispetto a OLMo, pur richiedendo la metà dei token necessari per il pre-training.
Qualunque cosa voglia dire, pare che queste siano le basi sulle quali funzionerà iOS 18, che vediamo l’ora di vedere in azione.
Per chi ne capisce di più, vi lasciamo i link per approfondire il tutto:
OpenELM: An Efficient Language Model Family with Open-source Training and Inference Framework
OpenELM database su Hugging Face
Lascia un commento