Meta bracht onlangs NotebookLlama uit. Dit is een ‘open’ implementatie van de populaire podcastgeneratorfunctie die oorspronkelijk is ontwikkeld door Google. En wel in hun NotebookLM-project.
NotebookLlama is in feite een poging om een alternatief te bieden voor de manier waarop NotebookLM interactieve, podcastachtige samenvattingen creëert van tekstbestanden. Dit concludeert TechCrunch. Hierbij leunt Meta sterk op hun eigen Llama-modellen. Die vormen de kern van de verwerkingscapaciteiten van deze nieuwe tool.
Dynamisering van de tekst
De werking van NotebookLlama begint met het omzetten van een tekstbestand, zoals een PDF van een nieuwsartikel of een blogpost, in een gesproken transcript. Het voegt daarbij ‘meer dramatisering’ en onderbrekingen toe, waardoor het geheel dynamischer moet aanvoelen. Vervolgens wordt het bewerkte transcript verwerkt door open-source tekst-naar-spraak-modellen die de tekst omzetten in gesproken taal.
Lagere kwaliteit dan Google
De geluidskwaliteit blijft echter achter bij die van Google’s NotebookLM. In de voorbeelden van NotebookLlama klinkt de stem namelijk nogal robotachtig. Met merkbare onnatuurlijke pauzes. En af en toe ongepaste overlap in de spraak.
Hoewel de technologie veelbelovend is, vertoont deze versie van NotebookLlama nog kinderziektes, vooral door beperkingen in het tekst-naar-spraak-model. De ontwikkelaars bij Meta geven aan dat de kwaliteit van de gegenereerde audio aanzienlijk verbeterd kan worden door het gebruik van geavanceerdere modellen.
Ze benadrukken op hun GitHub-pagina dat dit model momenteel als een proefversie moet worden beschouwd. Ze geven ook suggesties voor toekomstige verbeteringen, zoals het toevoegen van een ‘debat’-functie waarbij twee stemmen een dialoog over het onderwerp voeren.
Hallucinaties
NotebookLlama is niet het eerste project dat probeert om de functies van NotebookLM na te bootsen, en de resultaten zijn gemengd. Zoals met veel AI-toepassingen, blijft ook hier het probleem van ‘hallucinaties’ bestaan. AI-modellen kunnen namelijk nog steeds onjuiste of verzonnen informatie in hun samenvattingen verwerken.
Dit betekent dat gebruikers voorzichtig moeten blijven bij het consumeren van AI-gegenereerde inhoud. Ondanks deze tekortkomingen biedt NotebookLlama een open platform dat ruimte laat voor innovatie en verbetering, en het zet een interessante stap in de evolutie van AI-gestuurde podcastgeneratie.