• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    KOJAProgramovani 40+
    JANFROG
    JANFROG --- ---
    ALMAD: A tady bych si zase vzpomel na slova Michael Lippautz (Google V8) z lonskeho leta "Almost every security problem turned out to be correctness problem. We do not like it, but that's what we have learned the hard way."
    SH_PANDA
    SH_PANDA --- ---
    tak context window neni reseni, resenim je mcp, ktery dela "code intelligence". prave neco takoveho pisu.
    ALMAD
    ALMAD --- ---
    ANT_39: Co ze to bude vetsi sracka, ale tech bezpecnostnich srand co s tim bude…ano budem mit veci jako Aisle co s tim hypoteticky pomuzou, ale jenom lidem co je budou pouzivat…a to moc nevidim vzhledem k tomu co ted vyplouva na povrch a kdo to propaguje.
    PES
    PES --- ---
    ALMAD: tak ten čínskej DeepSeek žere tokeny ne po vagonech,a le rovnou to hltá po celých zaoceánských lodích ;-)))
    PES
    PES --- ---
    E2E4: tomu se přece říká vývoj/evoluce ;-)
    ALMAD
    ALMAD --- ---
    PES: To se deje uz ted, a aspon co. vidim, vysledky jsou o neco lepsi za cenu o dost vetsiho token burnu.

    Ale nevidim tam nejakej fundamentalni posun, protoze to context window je proste problem, i proto sem zvedavej o kolik pouzitelnejsi bude ten novej Opus s 1M window (za cenu par dalsich km pralesa).
    ANT_39
    ANT_39 --- ---
    PISKVOR:
    write-only vs. read-only, kontextové okno, a hackuje se to rovnákama na vohejbák
    Jo, přičemž to, že se do toho zamotává a přestává tomu rozumět, a bylo by potřeba udělat krok zpět a investovat práci do vyčištění, nebo v prvý řadě ideálně nemergovat redundantní hacky, na to v tom nekonečným cyklu není prostor.
    zaplavení krajiny spoustou jednorázových protodukčních nástrojů
    Jo, SW bude nadále ještě větší sračka než doteď, to se máme na co těšit.
    jednorázový nástroj lze ale dělat jen na malý, dobře definovaný a ohraničený problémy
    Jo, přičemž jak píšu, zřejmě dost práce proběhlo před začátkem experimentu. Jak bude někdo psát pečlivou a důkladnou test suitu pro libovolnej problém, kterej není futrovanej +- jednoznačnýma standardama, bych rád viděl.

    JANFROG: Já na ty backendy vůbec nekoukal, ale tak nějak když tam čtu, jak to produkuje pro real mode příliš velkej kód, tak tam nic takhle sofistikovanýho spíš nebude. Do lexeru jsem koukal, protože lexikální analýza je lehkej problém, a poté, co jsem to viděl, tak ta představa, jak po něm luštím x86_64 volací konvence, alokace zásobníku, atp., mě láká pramálo.
    E2E4
    E2E4 --- ---
    PES: AI-rovnák na AI-vohejbak. :)
    PES
    PES --- ---
    E2E4: to se časem zřetězí - po AI-tvůrčí to pak dostane AI-Kritik a po něm AI-Refactoring a pak možná i AI-Optimalizátor/Optimus... a bude to.
    E2E4
    E2E4 --- ---
    ANT_39:
    1/ impressive
    2/ tohle je holt omezení, LLM nepojmou velký kód a tak od určitý velikosti začnou rozvíjet i to co dosud fungovalo..
    3/ tohle je holt omezení, LLM "rády" píšou.. tak píšou věci dvakrát.

    s 3 souvisí to, že se 50 let snažíme přijít na to, jak je "správné" programovat, oop, tdd, a výsledek je, že to dáme AI, stačí že to vypadá že to funguje a nevadí že to na 2 prakticky stejný problémy napíše 2 prakticky totožný funkce..
    JANFROG
    JANFROG --- ---
    SH_PANDA: Zalezi na tom, co vsechno povazujes za "skodu". Pokud za tu "skodu" beres i vsechny negativni externality, pak se obavam, ze to neni jen skill issue :-)
    SH_PANDA
    SH_PANDA --- ---
    to rozhodne, ale je to skill issue, stejne jako s bagrem ;)
    PES
    PES --- ---
    SH_PANDA: také to oproti lopatě umí napáchat mnohem větší škody...
    SH_PANDA
    SH_PANDA --- ---
    PES: akurat ze je to bagr :)
    JANFROG
    JANFROG --- ---
    ANT_39: Kdyz jsem to cetl (ten blog post) tak jsem si nemohl nevzpomenout na to co psal Gregory Chaitin ve sve retrospektive (2003) ke svemu (legendarnimu) clanku Register Allocation and Spilling via Graph Coloring (1982 !):
    So I regard the success of this approach, which has been the
    basis for much future work, as a triumph of the power of a
    simple mathematical idea over ad hoc hacking. Yes, the real
    world is messy and complicated, but one should try to base
    algorithms on clean, comprehensible mathematical ideas...
    SH_PANDA
    SH_PANDA --- ---
    ZAHRADKAR: yolo je u projektu kde by byl data exfiltrace problem to ze ctu jenom bash commandy, kod nectu a max klikam do ui. u tech co mam na githubu tak --dangerously-skip-permissions.
    PES
    PES --- ---
    PISKVOR: přesně - je to jen (ná)STROJ! - jako lopata ;-)))
    PISKVOR
    PISKVOR --- ---
    Vlastně ta hlavní chyba, která nás bude kousat do zadku už furt, je antropomorfizace. "Model říká, počítač si myslí, agent chce" - ano, užitečný způsob, jak o tom vzájemně komunikovat (a taky super způsob, jak to prodávat), ale taky zákeřný: nastavuje v hlavě očekávání, jaká máme u lidí. Leč ten model se bude, každý a pokaždý, chovat jinak, z principu.

    #eliza
    PISKVOR
    PISKVOR --- ---
    ANT_39:

    - ano, všichni provideři to těžce dotují; co by se stalo, kdyby to nebylo za půlku? třetinu? nákladů, to uvidíme asi v příštím FY.

    - vysypat write-only kód na zelený louce je easy (a vypadá to SKVĚLE na prezentacích - "ó, zrušíme mzdový náklady: kůň Hans umí počítat do pěti, takže určitě umí počítat i do sta, i odmocňovat, integrovat a derivovat, to dá rozum!")

    - ale zrada, většina kódu je read-only (ve smyslu "upravuje se vždy jen malá část"). To je problém veškerého vývoje, ale zejména u agentů je to problém "nevejde se kontext do vokna" a hackuje se to rovnákama na vohejbák.

    - ano, možnost "vždycky si udělám jednorázový prototyp a pak ho zahodím a udělám si nový jednorázový nástroj" se zřejmě dost rozšíří. (z čehož i zaplavení krajiny spoustou jednorázových protodukčních nástrojů, který ale to svoje nedělají úplně blbě, a tak se na ně každý bojí sáhnout)

    - jednorázový nástroj lze ale dělat jen na malý, dobře definovaný a ohraničený problémy - větší codebase reprezentuje zejména paměť instituce: "tohle nech bejt, ač to vypadá divně: když budu tady násobit dva floaty a dělit to DPH, přijde na nás berňák; když tady nepošleš dva dummy bajty navíc, tak to protějšek neschroupe, ač je to dle specky". Tyhle věci při zahození a úplném rewritu zmizí.

    - vposledku je i ten postup "menežuju agenty" je jen metajazyk: "definuju naprosto přesně a striktně zadání, vstupy, výstupy, očekávané chování, řešení chybových stavů, neprogramuju, kdepak, jen transformuju požadavky do jazyka, který je srozumitelný strojům! To přece...není...programování! Že ne....?!!" Neboli ano, hlavní role vývojáře byla vždycky MYSLET, jestli to převádí do spustitelné podoby děrováním štítků, psaním ve VBScriptu, popisem v angličtině, nebo výrazovým tancem, to je nakonec buřt.

    (jistě, některé z těch postupů otevírají dveře k vývoji i lidem, který bych ani já, ani oni, nenazval vývojáři. To bylo pokaždý: "assembler není opravdovej jazyk, to je hračka pro děti!!!" "Makra v Excelu nejsou opravdovej jazyk..." etc)
    VONTRIX
    VONTRIX --- ---
    KOLCON: Prolog, Haskell, VRML, Simula ... je toho dost
    Kliknutím sem můžete změnit nastavení reklam