NVIDIA släpper PersonaPlex som öppen källkod för röstkonversationer i realtid

LLMagents
Diverse professionals animatedly discussing in a bright office meeting

NVIDIA släpper PersonaPlex som öppen källkod för röstkonversationer i realtid

NVIDIA har släppt PersonaPlex 7B, en helt öppen konversations-AI som hanterar realtidstal med full duplex, naturliga avbrott och överlappningar [4]. 7B-modellen uppnår 0,07 sekunders latens för talarbyten—nästan 20 gånger snabbare än baslinjemodeller—samtidigt som den stöder personakontroll genom text- eller ljudprompts [5].

Det tekniska genombrottet ligger i förmågan att samtidigt lyssna och tala, och hantera den röriga verkligheten i mänsklig konversation: backchannels, avbrott och naturlig rytm [4]. Tillgänglig på GitHub och Hugging Face väcker den entusiasm som potentiellt den "första AI:n som kan avbryta mitt i en mening," vilket fundamentalt förändrar hur vi tänker på konversationsapplikationer [5].

GitNexus förvandlar kodbaser till interaktiva kunskapsgrafer

Ett nytt verktyg med öppen källkod som heter GitNexus får viral uppmärksamhet för att förvandla GitHub-repositories till interaktiva kunskapsgrafer [6]. Den serverlösa lösningen körs helt i webbläsaren och använder AST-parsing för att kartlägga beroenden, anropskedjor och kodkluster samtidigt som den integreras med Claude och Cursor för smartare redigering [7].

Med 16 000 GitHub-stjärnor på bara några veckor representerar GitNexus en förskjutning mot klientsidans kodintelligens för AI-agenter [6]. Verktyget möjliggör "blast radius-analys" och Graph RAG för kodutforskning, med användare som berömmer dess förmåga att ge AI-agenter ett "nervsystem för kod" [8]. Diskussioner på Reddit och Hacker News lyfter fram den växande efterfrågan på kunskapsgrafmetoder för kodförståelse.

NAVER släpper Sommelier för podcast-transkriptionspipeline

NAVER AI släppte Sommelier som öppen källkod, en omfattande pipeline för att bearbeta flerturskonversationsljud inklusive talardiariesering, överlappningshantering och borttagning av bakgrundsmusik [9]. Systemet kombinerar ensemble ASR (inklusive Whisper) med specialiserade moduler för träning av full-duplex talmodeller [10].

Släppt för fem dagar sedan med en detaljerad 34-sidig forskningsartikel adresserar Sommelier den komplexa utmaningen att kurera högkvalitativ konversationsdata i podcaststil [9]. Den skalbara pipelinen är specifikt designad för att träna nästa generations talmodeller som kan hantera rörigheten i verkliga ljudkonversationer [11].

Vad det här betyder för dina möten

Dagens släpp pekar mot en fundamental förskjutning i hur vi fångar och organiserar professionell kunskap. Karpathys "idéfil"-metod antyder att framtiden inte handlar om komplexa RAG-system, utan enkla, underhållbara kunskapsbaser som LLM:er kan fylla och söka i naturligt. Kombinerat med NVIDIAs konversations-AI i realtid rör vi oss mot mötesupplevelser där AI kan delta lika naturligt som vilken kollega som helst—lyssna, svara och till och med avbryta på lämpligt sätt när det behövs.

Konvergensen av dessa teknologier—från GitNexus kunskapsgrafer för kod till Sommeliers ljudbearbetning—signalerar att 2026 kommer att vara året då kunskapshantering blir verkligt konversationell. Dina mötesutskrifter kommer inte bara vara sökbar text, utan levande kunskap som kopplar till ditt bredare arbetssammanhang genom intelligenta grafer och naturliga språkgränssnitt.

Huvudpoäng: Eran av passiva mötesinspelningar tar slut. Den nya stacken kombinerar realtidskonversation, automatisk kunskapsstrukturering och enkel men kraftfull sökning—vilket gör varje möte till en byggsten i din personliga kunskapsbas.

Källor

  1. https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f
  2. https://x.com/karpathy/status/2040470801506541998
  3. https://antigravity.codes/blog/karpathy-llm-wiki-idea-file
  4. https://research.nvidia.com/labs/adlr/personaplex
  5. https://github.com/NVIDIA/personaplex
  6. https://github.com/abhigyanpatwari/GitNexus
  7. https://mintlify.com/abhigyanpatwari/GitNexus/introduction
  8. https://medium.com/@reliabledataengineering/gitnexus-the-tool-that-gives-ai-agents-a-nervous-system-for-code-7c9e7ceb58d6
  9. https://github.com/naver-ai/sommelier
  10. https://arxiv.org/abs/2603.25750
  11. https://kyudan1.github.io/sommelier.github.io

Få den dagliga briefingen

AI, kunskapsgrafer och framtidens arbete — i din inkorg varje morgon.

Ingen spam. Avsluta när du vill.