Chi capisce meglio l’italiano? Gemma, DeepSeek o OpenAI (open weight) cover art

Chi capisce meglio l’italiano? Gemma, DeepSeek o OpenAI (open weight)

Chi capisce meglio l’italiano? Gemma, DeepSeek o OpenAI (open weight)

Listen for free

View show details

About this listen

OpenAI ha rilasciato i suoi modelli open weight e noi li mettiamo subito alla prova, in locale, contro DeepSeek e Gemma. In questa puntata di Uno Nessuno e Centomil AI smontiamo l’hype con test reali: reasoning su indovinello, logica combinatoria (strette di mano) e traduzione idiomatica inglese-italiano. Spieghiamo con esempi chiari la differenza tra open source vs open weight, cosa significa far girare un LLM on-prem (privacy, costi, latenze), e perché strumenti come Ollama e Open WebUI sono utili per orchestrare più modelli in parallelo. Parliamo di licenze Apache/MIT, limiti di trasparenza (black box) e di come agenti verticali e federated learning possano cambiare il gioco.Risultato? In questi test Gemma (4B) sorprende per naturalezza e velocità; DeepSeek inciampa sull’italiano; l’open weight di OpenAI (20B) mostra muscoli ma anche qualche scivolone sul contesto. Il punto non è “chi è il più grosso”, ma quale modello è giusto per il compito: traduzione, chiarezza, reasoning leggero o pipeline aziendali on-prem dove i dati restano in casa. Se vuoi capire davvero come scegliere e testare un LLM oggi, questa è la guida pratica — zero fumo, solo prove replicabili. 00:00 — Intro & setup: OpenAI open weight vs DeepSeek vs Gemma02:52 — Open source vs open weight: cosa cambia davvero04:01 — Metafora “Star Wars”: licenze, black box e limiti di modifica06:46 — LLM on-prem: privacy dati, costi e latenze reali07:57 — Modelli e parametri: OpenAI 20B vs Gemma 4B (hardware richiesto)10:46 — Come testare un LLM: criteri oggettivi e rischi di leakage12:10 — Test di reasoning #1: l’indovinello dell’ascensore15:05 — Risultati a confronto: correttezze, tempi e catene di pensiero18:49 — Test di logica #2: quante strette di mano? (combinatoria)21:27 — Spiegazioni a confronto: formula vs chiarezza “umana”23:44 — Test di traduzione: idiomi inglese-italiano difficili26:01 — Traduzioni a confronto: DeepSeek vs Gemma vs OpenAI29:12 — Strategia: modelli specialistici, agenti verticali e orchestrazione30:35 — Prossimi passi: interfacce multi-modello e roadmap30:55 — Conclusioni & call-to-action: sperimenta e condividi i tuoi test

No reviews yet
In the spirit of reconciliation, Audible acknowledges the Traditional Custodians of country throughout Australia and their connections to land, sea and community. We pay our respect to their elders past and present and extend that respect to all Aboriginal and Torres Strait Islander peoples today.