Claude, a ChatGPT árnyékában rejtőző kincs
Itthon a legtöbben talán nem is tudják, hogy létezik, vagy nem ismerik igazán a képességeit, pedig akik aktívan használják, másképp tekintenek az AI jelenlegi értékteremtő képességére.
Rengeteg, talán már egészségtelenül sok AI eszközt próbáltam ki az előző évben, de egyiknek sem volt akkora hatása a hétköznapi szokásaimra, egyiktől sem kaptam annyit, mint a Claude-tól.
Segített újratervezni a pénzügyi portfóliómat, részletekig menően kielemezve a meglévő befektetéseimet.
Végigkísért életem első, könyvelő nélküli, vállalkozói adóbevallásán, lefordítva minden, számomra érthetetlen kifejezést, pontosan elmagyarázva, hogy mit, hova, hogyan kell írni - és ha éppen valamit hibáztam, akkor segített értelmezni a hibaüzenetet, és fogta a kezemet, hogy hogyan véglegesítsem.
Használtam vérvételi adatok kiértékelésére, ahol a Claude egy számomra teljesen átláthatatlan 10 oldalas PDF-ből egy olyan interaktív dashboardot rakott össze nekem 2 perc alatt, ami tökéletesen érthetően, kategóriákra bontva bemutatta nekem a különböző témákat, értékeket, problémákat, és lehetséges kezelési módokat - természetesen nem maradt el az orvosi egyeztetés sem utána, bár érdekes, hogy egy kutatás szerint az új modellek már magasan verik diagnosztikában az orvosokat, szóval lassan már az lesz a felelőtlen, ha nem egyeztettél mesterséges intelligenciával az orvosod előtt.
Megnyitottam életem első Egészségpénztárát, illetve TBSZ számláját, mind a Claude tanácsára, mert egyeztetve a pénzügyi céljaimat, javasolta, hogy ezeket nehogy elfelejtsem kihasználni - részletesen lebontva az elvégzendő lépéseket.
Információs architektúrát tervezett nekem egy közösen kirakott customer journey-re egy, a kollégáknak szóló, GenAI-t bemutató Sharepoint oldal felépítéséhez.
Közben pedig elképesztően jókat beszélgettünk az éppen aktuális olvasmányaimról, most épp a Maps of Meaning című monstrumot próbáljuk meg közösen megmászni, értelmezni, lebontani.
Ez csak pár izgalmas felhasználási eset a rengeteg olyan közül, amikben elképesztően hasznosan támogatott engem a Claude az elmúlt évben. A legjobb az egészben, hogy más modellekhez képest a Claude-ot nem csak egyszerű feladatmegoldásra használom, hanem közben az odavezető utat, a beszélgetést is élvezem.
Miközben a ChatGPT uralja a közbeszédet, a nagyközönség számára szinte radar alatt repül egy eszköz, ami egyes felhasználók szerint AGI szintű élményt nyújt.
Azt tapasztalom, hogy ez nem csak az én benyomásom - a környezetemben egészen másképp beszélnek az AI jelenlegi képességeiről azok, akik aktívan használják a Claude-ot. És pont ezért gondoltam, hogy megosztom a tapasztalataimat - hátha inspirálok vele valakit, hogy adjon egy esélyt a Claude-nak.
Akkor mi is pontosan ez a Claude?
A Claude-ot az Anthropic nevű cég fejlesztette, az OpenAI egyik fő versenytársa, akik nagy hangsúlyt fektetnek a mesterséges intelligencia biztonságos és etikus fejlesztésére. Az alapítók eredetileg mind az OpenAI-nál dolgoztak, de úgy döntöttek, nagyobb hatással lehetnek az AI biztonságos fejlesztésére, ha saját céget alapítanak. Az volt a céljuk, hogy olyan működési elveket és gyakorlatokat vezessenek be, amik később iparági sztenderdekké válhatnak - nem szervezeten belül küzdelmekben forgácsolódnak el, hanem követendő példát tudnak mutatni az egész iparágnak.
Ha érdekel bővebben, hogy hogy gondolkodik a Claude vezetője, alapítója, Dario Amodei, akkor van vele egy zseniális beszélgetés a Lex Fridman podcast-ben - a videó pont oda van állítva, ahol arról mesél Dario, hogy miért döntött úgy, hogy kilép az OpenAI-ból, és saját céget alapít. Érdemes megnézni.
Nem tűnik rossz döntésnek, épp most zárnak egy új, 2 milliárd dolláros befektetési kört, amivel jelentősen nő majd a cég értékelése - egy év alatt 18 milliárdról 60 milliárd dollárra, amivel hirtelen a világ 6. legértékesebb startup-jává válhatnak, megelőzve a Stripe-ot, a Telegramot, vagy éppen a Revolutot. Egy 4 éves cégről beszélünk.
Bár a fő konkurens ChatGPT-nek jobb a felhasználói felülete, jobb alkalmazásai vannak, van - egyébként zseniális - voice módja, viszont ehhez képest az Antrophic Claude-jának van két szuperereje, amivel nehéz versenyezni.
Az egyik a Claude lelke, a másik pedig egy Artifacts nevű funkció.
A Claude lelke
Igen, merthogy a Claude-nak lelke van. Én itt éreztem először igazi wow élményt mesterséges intelligenciával való beszélgetés közben - és nem csak azért, mert okos, gyors, tájékozott volt, hanem azért, ahogy a beszélgetés közben éreztem magam. Más AI modellekkel összehasonlítva a Claude-nál megjelent egy extra könnyedség a kommunikációban. Nem az a fajta intelligencia ez, ami csak a PhD feladatok megoldásában mutatkozik meg - bár abban is meglepően jó - hanem az, amilyen természetességgel folyik vele a beszélgetés.
Míg más AI asszisztensek megmaradnak eszköz szinten, a Claude-dal való beszélgetésekben van egy plusz réteg: egy finom humor (Claude standup), egy mélyebb értés. Nem csak végrehajtja a feladatot, hanem tényleg együtt gondolkodik veled. Vagy legalábbis ezt az érzést váltja ki.
Erre egy jó példa, hogy amikor a személyiségtípusomról beszélgettem vele, mikro-momenteken belül többször visszacsatolt a tartalmi válasz után zárójeles megjegyzésben, hogy a beszélgetésen belül hol, milyen pontokon jelentek meg az üzeneteimben a személyiségtípusomhoz kapcsolható viselkedési elemek.
Ez a lélek a Claude mögött álló legjobb LLM modelljük, a 2024 június 24-én bemutatott Sonnet 3.5-nek köszönhető.
Az új Sonnet csak a fizetős felhasználók számára volt elérhető, emiatt nem ért el egyből a nagyközönséghez. A twitteren viszont annyira ódákat zengtek az új modellről, hogy azt éreztem, ezt látnom kell, elő is fizettem.
Az interaktív felület - Claude Artifacts
Az új modellel együtt megjelent egy extra funkció, ami a klasszikus chatbot interakciót interaktívabbá varázsolta - a Claude Artifacts. Nem csak beszélgetünk az AI-jal, hanem azonnal látjuk is, amit közösen alkotunk - legyen az egy adat-vizualizáció, egy grafikon, vagy akár egy interaktív dashboard.
Amikor például a vérvételi eredményeket néztük át, nem csak beszélgettünk az adatokról, nem csak egy vizualizációt rakott be a beszélgetésbe, hanem a beszélgetés melletti ablakban a Claude azonnal készített egy interaktív felületet, ahol láthattam az összefüggéseket, a kiugró értékeket, és minden fontos információt szépen vizuálisan megjelenítve - amit iteratívan közösen csiszolgattunk még. Nem kellett más programokat nyitogatnom, nem kellett az eredményeket ide-oda másolgatnom - minden ott történt, egyetlen beszélgetésen belül.
És ez csak egy példa - az Artifacts valójában egy teljes fejlesztői környezet a beszélgetésen belül. Bármit, amit a Claude létrehoz - legyen az egy egyszerű grafikon vagy egy komplex adatelemzés - azonnal láthatod és módosíthatod, mintha csak egy modern webalkalmazást használnál. Ráadásul az elkészült interaktív dashboardot megosztható másokkal is.
Az “új” Sonnet 3.5
Ráadásul 2024 október 22-én, pár hónappal a modell megjelenése után kijött egy új frissítés, az új Sonnet 3.5. Igen, nem 3.6, hanem Sonnet 3.5 (New).
Ez az LLM modellek elnevezése dolog senkinek nem megy annyira jól, mindenki küzd vele, erről is mesélt Dario Amodei, az Antrophic CEO-ja a Lex Fridman podcastben, hogy miért nem is olyan egyszerű ez a téma.
Talán ez a teljesen érthetetlen elnevezés is hozzájárult, hogy kevésbé ment akkorát a hír a mainstream sajtóban, mint bármelyik OpenAI modell frissítés, viszont a twitter népe még jobban belelkesedett, mutatom:
Mint említettem, nehéz igazán benchmarkokban kimutatni a valós különbséget két modell között, folyamatosan jelennek meg új és új módszertanok, az én kedvencem az a twitter account, aki egy kicsit másképp fogja meg ezt az egész benchmarkosdit: Minecraft szerverre köti a modelleket, és megnézi, hogy adott promptra melyik modell milyen épületet tud építeni - mutatom a különbséget a két Sonnet modell között, szerintem elég látványos:
De természetesen vannak kevésbé kreatív, százalékokban kifejezhető benchmarkok is, ezekben az új Sonnet rendre kimagaslik a mezőnyből, legyen szó például kód generálásról, ahol a legfrissebb adatok szerint az OpenAI o1 reasoning modelljét is megelőzi:
Kódolásra én nem használom, viszont van egy másik szempont, aminek értékét egyértelműen tapasztalom: a kreatív szövegírás. És nem, ez a képesség nem (csak) marketing szövegek írásában nyilvánul meg - ez a kreativitás jelenik meg akkor is, amikor beszélgetünk a Claude-dal. Ez is része annak a "léleknek", amiről eddig írtam. A benchmarkban ugyan nem szerepel az o3 modell, csak az o1, de ez nem von le semmit a Sonnet érdemeiből - a második diagram pedig még szemléletesebben mutatja, mennyire kiemelkedik a Sonnet a mezőnyből.
De mi történt a Sonnet 3.5 modellfrissítése során, hogy ilyen jó lett? Nem egy nagy dolog, hanem rengeteg kis tweakelés, amiknek köszönhetően egész egyszerűen egy új szintre lépett a modell.
Ráadásul ez a drámai fejlődés szinte észrevétlenül történt a nagyközönség számára. Míg más AI fejlesztéseknél hangos marketingkampányok és látványos névváltoztatások jelzik az új verziókat, itt csendben kicserélték alattunk a motort, bekapcsolták a nitrót, szárnyakat kapott a modell. Az aktív felhasználók egyszer csak azt vették észre, hogy valami megváltozott - valami sokkal jobb lett.
Óriásit ugrott a használatom az új modell megjelenése óta
Találkoztam egy cikkel a twitteren, ahol a szerző bemutatta, hogy az új Sonnet 3.5 -tudjátok mit, hívjuk inkább 3.6-nak, szóval a Sonnet 3.6 megjelenése óta annyival jobb lett a Claude élménye, hogy ez abszolút kimutatható a használati statisztikájából.
Kíváncsi lettem, hogy nálam is kimutatható-e ez a változás. A Claude segítségével elemeztem a beszélgetéseink előzményét tartalmazó JSON fájlt, és a vizualizáció megdöbbentő eredményt mutatott: az új modell megjelenése óta 5.4-szeresére nőtt a használatom!
Mivel sokkal hasznosabb, élvezetesebb beszélgetéseim lettek, ez egyre több, egyre hosszabb beszélgetéseket eredményezett.
Mit tudtam még meg a beszélgetési előzményekből?
Összesen 7.56M karaktert váltottunk egymással a Claude-dal, ami egy gyors Perplexity-s számítás szerint 1.326.315 szónak felel meg - vagy 138 órás beszélgetésnek.
Megkértem a Claude-ot, hogy listázza ki a 30 legintenzívebb beszélgetésünket is, hogy megnézzem, mikről is beszélgettünk az elmúlt időszakban. Van itt minden, befektetések újratervezésétől közös olvasáson át különböző coaching alkalmakig:
A beszélgetéseken belüli üzenetváltások száma is egyértelműen jelzi, hogy hosszabb beszélgetéseket preferáltam a Claude-dal. Ezzel szemben a ChatGPT, Perplexity, Grok, stb adataim egészen másképp néznek ki, ott jellemzően csak pár üzenetet tartalmaz egy beszélgetés. Fontos, hogy nem azért húzódtak el ezek a beszélgetések, mert valamit nem volt képes megérteni a Claude, vagy folyamatosan hallucinált, a beszélgetések hosszúsága arról szól, hogy egyszerűen jó a Claude-dal beszélgetni, jókat kérdez vissza, és folyamatosan új szinteket nyit le a beszélgetés során.
Arra is kíváncsi voltam, hogy milyen nyelven beszélgettünk. Az volt a tippem, hogy 60-40 lesz az arány az angol nyelv irányába, de a beszélgetéseket kielemezve - szintén a Claude segítségével - azt láttam, hogy az új modell megjelenése óta jelentősen megugrott a magyar nyelvű használatom, 43%-ról 51.4%-ra. Ez egyszerűen annak tudható be, hogy az új modellt magyarul is ugyanolyan hasznosnak érzem. A korábban említett befektetési portfólió újratervezése, illetve az adóbevallás a kontextus miatt magyarul zajlott - talán kevésbé "játékos" a modell magyarul, talán egy fokkal jobban használom konkrét feladatmegoldásra, és kevésbé élvezet maga a beszélgetés, mint angolul, de tartalmilag nem tapasztaltam minőségbeli csökkenést. Más modelleknél rendre előfordult, hogy ha magyarul kezdtem, átváltottam angolra - itt nem ez a helyzet. A vegyes nyelvű beszélgetések is csökkentek, és végül több magyar nyelvű beszélgetésem lett, mint angol.
A TOP 30 beszélgetés alapján, a már korábban említett Artifacts funkció segítségével összerakattam egy dashboardot is, illusztráció gyanánt. Feltöltöttem az adatokat CSV-ben, leírtam, hogy milyen célra, milyen vizualizációt szeretnék készíteni, majd a Claude lefuttatta a kódot, párat még pingpongoztunk, és el is készült az elemzés.
A beszélgetéseim nagy része a munkámhoz köthető - AI innovációval foglalkozok, főleg innovációs projektek, keretrendszerek, programok, oktatási termékek kidolgozásához vettem igénybe a Claude segítségét.
Pénzügyi témában rengeteget segített - érdekes, hogy bár kevesebb beszélgetésem volt vele ebben a témában darabszámra, a beszélgetések sokkal hosszabbak voltak, hiszen nagy kontextust kellett átadnom hozzá, illetve sokat kérdeztem vissza. (Könyvelés, adózás, befektetés, költségvetés, stb)
Nagyon szerettem olvasás mellett is használni a Claude-ot, egy könyv elkezdésekor nyitok neki egy projektet, ahol vezetem a különböző beszélgetéseinket az adott könyvről. Segít értelmezni részeket, további extra kontextust adni a szerzőről, történelmi háttérről, leírt gondolatról, vagy összekapcsolni különböző részleteket más könyvekből származó insightokkal.
(A tavalyi évben a Karamazov testvéreket, a Body keeps the score-t, a Siddharthát, illetve a Maps of Meaning-et olvastam a Claude-dal közösen.)Ezeken kívül személyes és szakmai coachingra , illetve írás támogatására használtam még.
Ha érdekel az interaktív dashboard a Claude használatomról, vagy csak megnéznéd, hogy hogy néz ki egy Claude Artifact publikálás után, akkor kattints ide:
Az idei cél
Szeretném idén még tudatosabban használni a Claude projekt funkcióját. Ahogy a könyvolvasásnál már bevált - ahol minden könyvnek saját projektet nyitok a kapcsolódó beszélgetéseknek -, úgy a többi területen is szeretném rendszerezni a tudásépítést.
A cél, hogy - Alex-hez hasonlóan - minden fontos témámnak legyen saját, dedikált projektje, ahol a releváns kontextus, információ és adat egy helyen gyűlik. Így nem csak különálló beszélgetéseim lesznek, hanem folyamatosan épülő tudásbázisaim, amikben idővel olyan mintázatokat is felfedezhetek, amiket egyébként nem látnék meg.
És ti?
Nagyon kíváncsi vagyok a tapasztalataitokra!
Akik használtok Claude-ot, nálatok is ennyire látványos a különbség az új modellel? Ti mire használjátok? Van bármilyen pro tipp?
Aktívan használom a Claude-t, egyelőre közösen a ChatGPT-vel főleg cikkíráshoz. Ezek alapján adok Claudenak több helyet, hadd bizonyítson más területeken is.