MemPalace lagrer alt. Motene dine lagrer ingenting. Her er gapet.
MemPalace gikk fra 0 til 23 000 GitHub-stjerner pa 72 timer ved a argumentere for at AI-minne aldri skal kaste noe. Likevel kan det ikke innta en eneste motetranskripsjon. Den storste kilden til organisatorisk kunnskap er ikke engang med i samtalen.
Kjerneargumentet i MemPalace far plass i en eneste setning, og README-en uttrykker det nesten som et manifest: AI-minnesystemer skal lagre alt ordrett og aldri la en LLM avgjore hva som er verdt a beholde. README-ens formulering av konkurransen er skarp: "Other memory systems try to fix this by letting AI decide what's worth remembering. It extracts 'user prefers Postgres' and throws away the conversation where you explained why." Den setningen er grunnen til at prosjektet gikk viralt pa 72 timer. Det er ogsa den setningen som gjor motetranskripsjons-gapet sa ioyenfallende. Et system hvis hele eksistensberettigelse er a aldri kaste kontekst har ingen vei i det hele tatt for a innta den storste kilden til organisatorisk kontekst de fleste team har.
Denne artikkelen kartlegger det gapet aerlig -- hva MemPalace gjor riktig, hva det ikke adresserer, og hvordan en motenativ versjon av den samme ideen ville matte se ut.
23 000 stjerner pa 72 timer
Konteksten forst, kort, fordi hastigheten betyr noe. MemPalace lanserte 6. april 2026. Innen 24 timer hadde det passert 5 000 GitHub-stjerner. 8. april la det pa omtrent 23 000 stjerner og 3 000 forker, med 159 PR-er allerede innlevert. Medskaperne er skuespiller Milla Jovovich (ja, nettopp hun) og ingenior Ben Sigman, og lanseringen ble baaret av en tweet med over 1,5 millioner visninger.
Benchmark-pastandene som drev lanseringen -- "first perfect score on LongMemEval, beating every product in the space" -- viste seg a vaere mer kompliserte enn tweeten antydet, og fellesskapet plukket dem fra hverandre i sanntid. Vi dekket detaljene i den kontroversen aerlig i AI-minneuken-gjennomgangen, og vi kommer ikke til a ga gjennom det igjen her. Kortversjonen: hovedtallene sammenligner hentingsrecall med konkurrentenes end-to-end QA-noyaktighet, noe som ikke er en likeverdig sammenligning, og "100 % pa LongMemEval"-kjoringen involverte patcher skrevet mot akkurat de failende sporsmaalene. Det er reelt og verdt a vite.
Men de arkitektoniske ideene under markedsforingen er ogsa reelle, og det er hva denne artikkelen egentlig handler om. De 19 lese-skrive-MCP-verktoyene. Den lokale SQLite-kunnskapsgrafen. Vinger-rom-haller-skuffer-den romlige metaforen. Firelagslastingssystemet som starter en agent pa omtrent 170 tokens pa laveste niva. Insisteringen pa a lagre originale ordrett filer i "skuffer" som aldri oppsummeres bort. Det er reelle ingenioorvalg med reelle konsekvenser. Fjern lanseringshypen og det finnes et bidrag her som er verdt a ta pa alvor.
Sa la oss ta det pa alvor, i den ene retningen som betyr mest for menneskene som bygger moteverktoy: hva skjer nar man retter MemPalace mot et mote?
Hva MemPalace faktisk aksepterer som inndata
Samtalevineren finnes i mempalace/normalize.py. Fem formater stotttes, og listen er eksakt:
- Claude Code JSONL
- Claude.ai JSON
- ChatGPT
conversations.json - Slack-arbeidsomradeeksporter
- Generelle tekstfiler
Viningsmoodusene er like spesifikke. --mode convos parser chattstils-utvekslinger med turveksling. --mode projects vandrer gjennom kodebaser pa tvers av omtrent 20 filendelser. --extract general kjorer et regex-basert pass over ren tekst som leter etter overflatemonster: beslutninger, preferanser, milepeler, problemer, emosjonelle oyeblikk. Det er hele overflaten.
Alle fem inndataene deler en egenskap verdt a nevne: de er skrevne samtaler mellom en menneskelig bruker og en AI, eller asynkrone tekstkanaler med en forfatter per melding. Vineren forventer den formen. >-brukermarkoren, antagelsen om korte alternerende turer, fraveret av all taleridentitetssporing -- hvert designvalg i normalisereren reflekterer en inndataverden som ser ut som chat.
Hva MemPalace ikke aksepterer
Listen over ting samtalevineren ikke handterer er, i kontekst, hele formen av moteverdenen:
- Intet VTT-format. WebVTT er standardundertekst- og transkripsjonsformatet brukt av Zoom og en lang rekke videoverktoy. Det er ikke i normalisereren.
- Intet SRT-format. Det andre dominerende undertekstformatet brukt av transkripsjonspipelines. Ogsa fravarende.
- Ingen nativ Zoom-transkripsjonseksport. Verken via strukturert felt eller filgjenkjenning.
- Ingen Microsoft Teams-transkripsjonseksport. Samme.
- Ingen Google Meet-transkripsjonseksport. Samme.
- Ingen bevissthet om talerdiarisering. Chatteksporter har en taler per melding per definisjon. Motetranskripsjoner har flere talere per sesjon, med overlappende kontekst, avbrytelser og identitet som ma loses pa tvers av filer.
- Ingen tidsstempelbevaring. Motetranskripsjoner er forankret pa sekundet. Den forankringen er det som lar deg spore en beslutning tilbake til oyeblikket den ble tatt. Ingenting i vineren bevarer det.
- Ingen agendabevissthet. Moter er organisert rundt emner. Chatter er reaktive. Vineren har intet konsept om emnegrenser inni en sesjon.
- Ingen monologstotte. En lang uavbrutt strekning av en taler -- vanlig i stemmememoer, forelesninger og mange virkelige moter -- ser ikke ut som en chattutveksling og passerer ikke rent gjennom vineren.
To ytterligere fakta gjor gapet umulig a lese som en utilsiktethet. Ordet "meeting" forekommer null ganger i MemPalaces dokumentasjon og kodebase. Ordet "transcript" forekommer null ganger. Dette er ikke en forseelse a patche i en 1.0.1-utgivelse. Det er et designomrade prosjektet aldri gikk inn i.
Det er for ovrig helt greit. Prosjekter har lov til a avgrense seg. Poenget er ikke at MemPalace tar feil i a fokusere pa chattartefakter. Poenget er at ordrett-forst-filosofien er akkurat den filosofien moter trenger, og prosjektet som artikulerte den hoylydest er enna ikke i naerheten av inndataene der det ville betydd mest.
Hvorfor moter er strukturelt annerledes enn chatter
Det er verdt a vaere presis om hvorfor et chattformet minnesystem ikke bare kan absorbere et mote ved a behandle det som en tekstfil til. De strukturelle forskjellene er ikke kosmetiske.
Flertalersamtaler innen en enkelt sesjon. En chatteksport er en sekvens av enformeldinger. En motetranskripsjon er en enkelt sesjon med flere talere hvis turer overlapper, hvis kontekst avhenger av hverandre, og hvis identiteter ma spores gjennom hele filen snarere enn per melding.
Lange monologer fulgt av reaktiv diskusjon. Virkelige moter veksler mellom at noen snakker i ti minutter og en skur av tolinjesvar. Chattevinere antar kort turveksling. Begge formene bryter antagelsen.
Agendadrevet flyt. Moter er strukturert rundt emner som spenner over flere talere. Det samme emnet kan lopee i femten minutter, deretter vende kort tilbake tretti minutter senere. En meningsenhet her er ikke "en tur" -- det er "en diskusjon om X pa tvers av flere turer av flere mennesker." Chattevinere har intet konsept om dette.
Kryssmotekontinuitet. Sarah fra kundeteamet i denne ukens samtale er den samme Sarah neste uke, selv om hun dukker opp i et mote som MemPalace ville arkivere under et annet rom. Taleridentitet ma loses pa tvers av filer, ikke innenfor dem. Chatteksporter har ikke dette problemet fordi brukeren alltid er en person.
Beslutningsoyeblikk forankret i tidsstempler. Nar et mote beslutter noe, eksisterer beslutningen pa et spesifikt punkt i opptaket. Det tidsstempelet er hvordan du reviderer beslutningen senere. Et minnesystem som dropper tidsstempler ved inntak kan ikke svare pa "akkurat nar ble dette besluttet," som er sporsmalet som betyr mest nar beslutninger gar galt.
Handlingspunkter som spenner over moter. Noe som tildeles i mote A og loses i mote B er ikke to urelaterte fakta. Det er en trad. En chattformet ekstraktor ser dem som uavhengige observasjoner. En moteformet ekstraktor ma modellere selve traden.
Et minnesystem designet for chat behandler hver tur som en uavhengig enhet og lar korpuset forme seg nedenfra og opp. Et minnesystem for moter ma behandle hele samtalen som en enhet, og likevel ekstrahere strukturerte signaler -- beslutninger, forpliktelser, entitetsomtaler -- som spores pa tvers av sesjoner. Det er ikke den samme jobben.
Hva MemPalace gjor riktig
Dette er den delen av artikkelen der det ville vaert billig a vaere en hater. Den aerlige lesningen er det motsatte: de fleste av MemPalaces baerende arkitektoniske valg er akkurat hva et motenativt minnesystem ogsa ville trenge. Prosjektet er naermere "riktig monster, feil inndata" enn "feil monster."
Ordrett lagring som primitiv. "Skuff"-monsteret -- originalfiler bevart eksakt, aldri oppsummert over -- er det riktige baselaget for motetranskripsjoner. Moter er noyaktig den typen kilde der ekstraksjon mister kritisk kontekst. Formuleringen betyr noe. Noelingen betyr noe. Oppfolgingsspormalet som ingen svarte pa betyr noe. A lagre det ordrettee transkriptet og behandle enhver kompilert artefakt som en avledet visning opa er den arkitekturen moteverktoy burde bruke allerede og hovedsakelig ikke gjor. (For den bredere versjonen av det argumentet, se mote-til-wiki-gapet.)
Lokal-forst som standard. Motetranskripsjoner er blant de mest sensitive dataene en organisasjon eier. De inneholder kundesamtaler, interne uenigheter, navngitte personer som diskuterer ting de ikke ville skrevet ned. De nordiske datasuverenitetshekymringene er reelle og de forsvinner ikke. MemPalaces standard med a kjore pa lokal SQLite og ChromaDB, uten noen skyomvei pakreved, er riktig startposisjon. De fleste moteverktoy defaulter for tiden den andre veien.
Lese-skrive-MCP-verktoy. Dette er gjennombruddet ingen nevner tydelig nok. Nesten hver mote-MCP-server som har blitt levert hittil er skrivebeskyttet -- agenter kan soke transkripsjoner og hente oppsummeringer, men ingenting skriver tilbake. MemPalace leverer 19 verktoy og listen inkluderer eksplisitt add_drawer, kg_add, kg_invalidate og diary_write. Skriveoperasjoner er forsteklasses. Det er den arkitektoniske formen moteverktoy trenger a utvikle seg mot, og MemPalace er for tiden det tydeligste eksempelet pa det i apenkildekode-minneomradet.
Firelagslastingssystemet. Oppdelingen i L0 identitet, L1 kritiske fakta, L2 romgjenkalling, L3 dypsok er et reelt ingenioorvalg med en maalbar kostnad. Uavhengig reproduksjon plasserer faktisk L0+L1 naermere 600--900 tokens enn README-ens 170, men prinsippet holder: en agent som trenger kontekst hver gang den starter drar enormt nytte av en trinnvis lastingsmodell der det meste av informasjonen hentes bare nar den etterspoorres. Moteagenter som ma briefe seg om en person eller et prosjekt for de svarer trenger akkurat denne formen.
Skjema-som-fil-monsteret. MemPalaces struktur defineres i vanlige filer som LLM-en leser ved oppstart. Det er det samme monsteret Karpathy beskrev for den LLM-vedlikeholdte wikien -- en CLAUDE.md eller AGENTS.md som forteller modellen hvordan innhold skal kompileres inn i kunnskapsbasen. Det er portabelt, versjonskontrollerbart og tvinger mennesket til a tenke klart over hva kunnskapsbasen faktisk er. Moteverktoy har ikke adoptert dette monsteret i det hele tatt. Det burde de.
Hva MemPalace gjor feil (eller ikke i det hele tatt) for moter
Na den andre siden. Ta ideene over som gitt, og gapene for motesaken skjerpes raskt.
Vinger-rom-haller-metaforen mapper ikke naturlig pa moter. Moter er episodiske, ikke tematiske. Et enkelt entimesmote berorer fem "rom" verdt av emneomrader. A tvinge det inn i et enkelt rom mister krysstematisk kontekst. A dele det opp pa tvers av rom mister sesjonsenheten. Ingen av delene er riktig. Chatteminne er naturlig romformet fordi hver samtale stort sett handler om en ting. Moter er det ikke.
Samtalevineren forventer chattmonster, ikke motestruktur. Dokumentert over. >-brukermarkoren, den antatte turkadensen, fraveret av all talerkontinuitetssporing -- ingenting av det overlever kontakt med en virkelig transkripsjonsfil.
Kunnskapsgrafen er reell men begrenset, og motsigelsedeteksjon eksisterer faktisk ikke. Denne er viktig og overraskende. README-en demonstrerer gjentatte ganger motsigelsedeteksjon ("AUTH-MIGRATION: attribution conflict -- Maya was assigned, not Soren"). Leonard Lins uavhengige kodeegjennomgang fant null forekomster av "contradict" i knowledge_graph.py. En separat fact_checker.py eksisterer men er ikke koblet til KG-operasjonene. Prosjektet har anerkjent dette. For moter er motsigelsedeteksjon en av de mest verdifulle tenkelige funksjonene -- stred denne ukens beslutning mot forrige maneds? -- og akkurat na implementerer MemPalace det ikke, selv for inndataene det stotter.
Ingen taleridentitetsopplosning pa tvers av moter. "Sarah" i mote en og "Sarah Chen" i mote fem er forskjellige entiteter for MemPalace. Det finnes ingen stemmefingeravtrykking, ingen navnesammenslaaingspass, intet entitetsopplosningslag designet for samtalelyod. For at motekunnskap skal akkumulere -- hele grunnen til at man ville bygge dette i utgangspunktet -- ma taleridentitet loses ved kilden, ikke retrofattes ved sporringstidspunktet.
Ingen beslutningsekstraksjon. --extract general-moduset kjorer regex mot tekst som leter etter beslutninger og preferanser. Det fanger overflatemonster. Det forstar ikke motestruktur, som er der de fleste beslutninger faktisk bor ("ok, sa vi gar for det andre alternativet" er strukturelt en beslutning nettopp pa grunn av diskusjonen som kom for den). Motetranskripsjoner trenger ekstraksjon som er bevisst om samtalekonteksten, ikke monstermatching mot noekkelord.
Debatten ordrett-kontra-ekstraksjon, anvendt pa moter
Ta et skritt tilbake. MemPalaces "lagre alt ordrett"-posisjon er en pol i en gammel debatt. Den andre polen er moteverktoy som Granola, som lagrer forbedrede notater briljant og i stor grad kaster det ra transkriptet. Begge polene har et reelt argument bak seg. Ordrett-forsvarere har rett i at ekstraksjon mister kontekst. Ekstraksjonsforsvarere har rett i at ingen leser et firetimers transkript pa nytt.
Det aerlige svaret er at dette er en falsk binaer. Den riktige arkitekturen lagrer begge:
- Det ordrettee transkriptet, uforanderlig, sa ethvert oyeblikk kan spilles av og enhver ekstraksjon kan utledes pa nytt.
- Strukturerte signaler -- beslutninger, entiteter, handlingspunkter, taleridentiteter -- ekstrahert ved inntak og sporet pa tvers av sesjoner som forsteklasses objekter.
- Et enkelt sporringsgrensesnitt som lar deg na inn i begge lag avhengig av hva du trenger.
Det er ogsa den arkitekturen Karpathy beskrev for den LLM-vedlikeholdte wikien, med radata i en mappe og en kompilert, regenererbar wiki opa. Hvis du ikke har lest arbeidsflytguiden eller motekunnskap-formuleringen, gjor de det samme poenget i full lengde. Den skeptiske versjonen av den samme samtalen, inkludert tokenkostnads- og kontamineringshekymringene, er i LLM-wiki-skeptikerens guide.
MemPalace har tatt den ordrettee halvdelen pa alvor og ekstraksjonsdelen lett. De fleste moteverktoy har gjort det motsatte. Ingen av dem er ferdige.
Hvordan et motenativt MemPalace ville sett ut
Hvis man tok den arkitektoniske filosofien fra MemPalace og bygde den om for moter fra bunnen av, er komponentene ikke mystiske. Listen leser seg som en produktspesifikasjon.
- Nativt inntak av moteformater. VTT, SRT, Zoom, Teams, Google Meet, Otter-eksporter, ra lyd gjennom transkripsjon. Alt som produserer ord sagt av mennesker i et rom.
- Taleropplosning som en forsteklasses operasjon. Stemmefingeravtrykk, navneekstraksjon fra kontekst, kryssmoteidentitetssammenslaaing. "Sarah Chen" i uke fem forenes med "Sarah" i uke en uten at brukeren trenger a sporr.
- Beslutnings- og handlingspunktekstraksjon i inntakspipelinen. Ikke som en nedstroems chattefunksjon. Som en del av hvordan et mote blir et minne. Ekstraherte poster lever som forsteklasses entiteter i grafen, tagget med kildemote og tidsstempelet inni det.
- Kryssmotesyntese som en persistent artefakt. "Alt Sarah har forpliktet seg til over de siste seks motene" skal ikke vaere et chattsvar som forsvinner nar du lukker fanen. Det skal vaere en markdown-fil som eksisterer i morgen og oppdaterer seg inkrementelt etter det sjuende motet.
- En MCP-verktoyflate for bade lese og skrive. Leseverktoy for a soke transkripsjoner og hente entiteter. Skriveverktoy for a innta nye moter, oppdatere beslutningslogger, sla sammen taleridentiteter, flagge motsigelser. Skrivehalvdelen er den delen de fleste moteverktoy mangler i dag.
- Lokal-forst-arkitektur med EU-dataresidency som standard. Ikke som et enterprise-tillegg. Som startposisjonen. Dette er grunnkrav for europeiske kunder og i okende grad for alle andre.
Det er ikke et hypotetisk produkt. Vi har bygd det pa Proudfrog i maneder -- Proudfrogs MCP-server, for tiden i beta med fem skrivebeskyttede verktoy og skriveverktoy pa vei, er broen vi legger mellom motetranskripsjon og Karpathy/MemPalace-minnemonsteret. Det er den eneste setningen i denne artikkelen om vart eget produkt, og den er her fordi gapet denne artikkelen beskriver er gapet vi har bygd mot.
Det aapne sporsmalet
Problemet med ordrett lagring av moter er na synlig pa en mate det ikke var for to uker siden. MemPalace la den ene halvdelen av svaret pa bordet, veldig hoyllydt. Moteverktoyene har det meste av den andre halvdelen men innser enna ikke at de trenger MemPalaces halvdel. Sporsmalet for de neste tolv manedene er hvem som lukker avstanden. Legger MemPalace til motestotte? Adopterer et moteverktoy MemPalaces ordrett-forst, skrive-tilbake, lokal-forst-arkitektur? Ankommer en ny aktoer og gjor begge deler samtidig?
Uansett svaret er gapet na lesbart, og den synligheten er den delen som manglet. Man kan argumentere om hvem som er best posisjonert til a lukke det. Man kan ikke lenger argumentere for at det ikke er der.
Ofte stilte sporsmal
Hvorfor stotter ikke MemPalace motetranskripsjoner?
Det ble ikke bygd for dem. MemPalaces samtaleviner er designet for chattformede artefakter -- Claude Code-logger, ChatGPT-eksporter, Slack -- der hver melding har en forfatter og turkadensen er kort. Motetranskripsjoner har en fundamentalt annerledes struktur: flere talere per sesjon, lange monologer, agendadrevet emneflyt og tidsstempler som forankrer beslutninger. A stotte dem ville kreve a legge til native parsere for VTT, SRT og de store moteplattformenes eksportformater, pluss et taleropplosningslag som for tiden ikke eksisterer noe sted i kodebasen. Det er et annet designomrade, og ordene "meeting" og "transcript" forekommer begge null ganger i prosjektets dokumentasjon. Det er det tydeligste signalet om at dette var et bevisst avgrensningsvalg snarere enn en forseelse.
Kan jeg bare lagre motetranskripsjonen min som en tekstfil og mate den til MemPalace?
Du kan, og det kommer ikke til a krasje. Den generelle tekstmodusen aksepterer det, den regex-baserte ekstraktoren trekker overflatemonster ut av det, og resultatet lander i en skuff. Det du mister er alt som gjor en motetranskripsjon nyttig: taleridentitet, tidsstempler, agendagrenser, distinksjonen mellom en monolog og en diskusjon, og all kryssmotekontinuitet for personene involvert. Du ender opp med en ordrett blob som er sokbar men ikke strukturert. Det er bedre enn ingenting, og mye verre enn hva en moteformet pipeline ville gitt deg.
Hva er forskjellen mellom MemPalaces ordrettee lagring og Otters fullstendige transkripsjon?
Otter lagrer transkripsjonen og eksponerer den gjennom sok og en chatbot. MemPalace lagrer radata i "skuffer" og behandler dem som uforanderlig kildemateriale som alt annet utledes fra, med eksplisitte skriveverktoy for a oppdatere en kunnskapsgraf opa. Den filosofiske forskjellen er hva hvert system mener lagringen er til for. Otter behandler transkripsjonen som produktet. MemPalace behandler den ordrettee filen som det betrodde kildelaget under en kompilert, sporrbar graf. Otter-tilnaermingen er enklere a bruke i dag; MemPalace-tilnaermingen er naermere den arkitekturen man vil ha hvis man bryr seg om kunnskap som akkumuleres pa tvers av sesjoner.
Er MemPalaces kunnskapsgraf god nok for motebeslutninger?
I sin navarende form, nei. Grafen er reell -- SQLite-stottet, subjekt-predikat-objekt-tripler med temporale gyldighetsvinduer -- og den temporale modellen er genuint nyttig. Men motsigelsedeteksjon, som er en av de mest verdifulle tenkelige funksjonene for en motebeslutningslogg, er ikke implementert i koden til tross for at README-en antyder det. Uavhengig kodeegjennomgang av Leonard Lin bekreftet dette og prosjektet anerkjente det. For a spore beslutninger pa tvers av moter -- "stred denne ukens samtale mot forrige maneds?" -- er grafen et utgangspunkt, ikke et ferdig verktoy.
Hvordan skiller Proudfrog seg fra en motenativ versjon av MemPalace?
Den korteste maten a si det pa: Proudfrog begynner der MemPalace slutter. Proudfrog handterer delene MemPalace ikke gjor -- opptak, transkripsjon, talerdiarisering, identitetsopplosning pa tvers av moter, beslutnings- og handlingspunktekstraksjon, og et kunnskapslag som oppdaterer seg selv nar nye moter ankommer -- og er bygd lokal-forst med EU-dataresidency fra begynnelsen. Proudfrogs MCP-server (leseverktoy i dag, skriveverktoy neste) er ment a spille den samme rollen for moter som MemPalaces MCP spiller for chatter. Vi er ikke de eneste som kunne lukke dette gapet, men vi har bygd mot akkurat denne formen i maneder, og mange av designvalgene i MemPalace ser kjente ut for oss nettopp av den grunn.
Bor jeg vente pa at MemPalace legger til motestotte?
Hvis du trenger det i dag, nei. Prosjektet er tre dager gammelt i skrivende stund, bidragsyterne er responsive men veikartet er opptatt med mye mer umiddelbare saker (benchmark-metodologien, AAAK-komprimeringspastandene, motsigelsedeteksjonsgapet), og moteinntak ville kreve et substansielt nytt delsystem snarere enn en liten patch. Hvis du er en utvikler som vil eksperimentere med ideene, fork det og forsook a skrive en VTT-normaliser -- det er akkurat den typen bidrag prosjektet sannsynligvis ville onsket velkommen. Hvis du trenger en fungerende pipeline for teamets moter na, se pa verktoy som ble bygd for moter fra starten og som tar den ordrettee og kompilerte arkitekturen pa alvor. Kunnskapsarbeidernes bruksomrade og funksjonssiden er de naermeste beskrivelsene av hvordan vi tenker rundt det.