• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    KOJAProgramovani 40+
    JARDABEREZA
    JARDABEREZA --- ---
    AI asociace napsala článek o reportu s (ne)užitečností AI: https://asociace.ai/novy-report-mit-95-firem-z-generativni-ai-nic-neziska/ ...když to tady už probíráme :-)
    LUDWIG_
    LUDWIG_ --- ---
    MARASAN: na jednu stranu me napadlo, ze podobnou humoresku mohl clovek zazit uz davno pred LLM, napr. s nakym levnym outsource juniorem z Indie.
    Pamatuji si, ze mi kdysi nekdo vypravel hororovy historky z bankovniho korporatu, kde meli zhora narizenou 100% code coverage, tak to kluci z Indie vyresili jak AI, tedy meli tam spoustu unit testu, co nic netestovaly, jen naslepo poustely kod, aby mel coverage. Holt na debilni narizeni jeste debilnejsi reseni.
    MARASAN
    MARASAN --- ---
    LUDWIG_: uz se chova jako clovek, AGI je za rohem! #kec
    LUDWIG_
    LUDWIG_ --- ---
    CERMI_FOX: ja jsem to jednou zkousel a po pul hodine loopu se LLM agent to rozhodl vyresit tak, ze testy smaze, protoze byly moc striktni, a voila "all tests pass now" lol
    CERMI_FOX
    CERMI_FOX --- ---
    Hodne pomaha,kdyz ma ai moznost feedback loop, tedy ze si to kompiluje, spousti testy apod. Nebe a dudy. Sice to pise furt stejne blbe, ale zase si to po sobe opravuje
    IXTREMIST
    IXTREMIST --- ---
    S AI dělám poslední dobou dost - zkouším jak dobře zvládá mainframe (cobol,REXX,asma90, jcl, dfsort).
    musím se přiznat, že velmi často končím promptem ala:
    "Are you fckin dumb? 5 times I told you syntax XYZ is wrong and using stack algorithm is prohibited in this scenario. and you still do that. il write that myself."
    TMA
    TMA --- ---
    Moje zkušenost s LLM programováním je, že buď to dá na první pokus, nebo vůbec. A často to vypadá jako:

    Uživatel: Dej mi recept na mramorovou bábovku.
    LLM: Výborný nápad!!! ... čtvrtina postupu jak se stát sochařem ... Chceš pomoci s výběrem mramoru, nebo tě mám naučit, jak sochat pískovec?
    Uživatel: Ale bábovka je pečivo!
    LLM: Jejda, omlouvám se. 😂
    Tady je recept na chleba. ... recept na rohlíky, včetně postupu jak je rolovat, ale nakonec je tam doporučení je smažit ve fritéze místo péct ... Na závěr můžeš bochník posypat drceným mramorem a získáš mramorovou bábovku.
    CERMI_FOX
    CERMI_FOX --- ---
    QWWERTY: to mi připomíná příhodu nedávnou, nechal jsem ai agenta udělat nějakou otročinu s přepisováním a modifikací xml. Práci udělal dobře, ale pak se rozhodl, že to po sobě ověří a napsal powershell skript, co nad tím pustí nějaké adhoc testy. Ten obsahoval syntaktickou chybu. Ale agent to nevzdal a zkusil jiný přístup a ten už mu vyšel na výbornou:

    KLEINZACH
    KLEINZACH --- ---
    :)
    Senior Engineer tries Vibe Coding.
    https://www.youtube.com/watch?v=_2C2CNmK7dQ
    QWWERTY
    QWWERTY --- ---
    RUDOLF: a kdo myslis, ze ti bude psat ten monitoring a testy? junior s LLM :D

    a: vsak ti to nefunguje
    b: Ale Pipeline jE zeLENa
    JANFROG
    JANFROG --- ---
    RUDOLF: To mas pravdu. v tomhle jsem rozhodne poznamenany dostavadni zkusenosti.

    Nicmene jsi mluvil o Amazonu a Amazoni infrastruktura (a tedy i SW) je dneska, at se nam to libi nebo ne, kriticka nejen pro mnoho firem, ale i pro mnoho vlad.

    Je treba mit (neustale) na pameti, ze security ~ correctness
    JARDABEREZA
    JARDABEREZA --- ---
    E2E4: Já jsem jí dokonce i četl :-D

    A je v ní pár problémů kvůli kterým to potřebuje víc vyzkumu:
    - nedostatečná p-value... netestovali to na dostatečně velkém vzorku aby tam byl statistická významnost... píšou to i sami autoři té studie... chce to víc lidí a testů
    - oni to testovali na open-source projektech s tisíci stars a zkoušeli řešit nějaké jejich issues

    Takže je celkem jasné, že když půjdu např. na Github repo a vyberu si, že vyřeším nějaké issue v Reactu nebo jiné oblibené věci, tak tam bude nějaký unikatní obtížný problém.

    Pokud by mi AI pomáhala např. jen psát další web, kterých už jsou miliony, bude to mít zase jiný výsledek.
    JINX
    JINX --- ---
    E2E4: ja na to mam ale vlastni data v podobě času a počtu výstupů, a nepochybuji ze pokud mas nějaký korporátní moloch který ani pořadně nejde zaindexovat tak to bude problem... omezil bych se tak na nějaké generování funkci a to ještě pokud není potřeba prostudovat cely projekt a resit milion dependencies...
    E2E4
    E2E4 --- ---
    JINX: a viděl jsi tu studii, že subjektivní dojem programátorů je že jim AI hrozně pomáhá, ale když se to změří, ukáže se, že to vyjde plus mínus nastejno? :)
    E2E4
    E2E4 --- ---
    RUDOLF: jj, plus je problém, že když to děláš pořádně, konkurence která to dělá "hlavně rychle" tě předežene..
    E2E4
    E2E4 --- ---
    PJOTRIK: přesně, PoC vám funguje, takže už to máte skoro hotový tak jsme to včera prodali zákazníkům.. :)
    JINX
    JINX --- ---
    JARDABEREZA: v zasade to takhle delam ted, trvalo mi nějakou chvíli prijit na to jak to dělat a jak si všechno nastavít aby to nedělalo i věci které nechci, ale nějaký boilerplate funkcni prototyp to udela a zbytek uz si udělám po svém. Nějakou komplexnější aplikaci jsem nad tím ještě nepsal píšu jen transformace dat, datascience a ML... a jsem s tím minimálně 10x produktivnější.

    Mam ale v planu napsat si nějaké aplikace pro iOS (který teda vůbec neumím) tak třeba uvidím ze to vůbec nefunguje.
    RUDOLF
    RUDOLF --- ---
    JANFROG: hele ty roky vyvíjíš v určitým segmentu a podmínkách. Feynmanuv pohled je idealistický, ale taky tuna kódu je dočasná, business value a kapitalismu, potřebuje občas jiný přístup. Je prostě rozdíl jakou kritikalitu má tvůj kód a věř mi, spousta kódů nemá takovou užitnou hodnotu, aby musel být téměř dokonalý.

    Je místo pro dokonalé dwtermisnticke chování software a je místo, kde nevadí spájeny hack. Jasné, až management bude urychlovat vývoj sw nějakýho letadla pomocí LLM, bude to asi průser. Ale většina věcí nemá takovou kritikalitu
    JARDABEREZA
    JARDABEREZA --- ---
    PJOTRIK: Třeba je osvítí účet za AWS nebo Azure :-D ...ale co já vím. Není to moje oblast :-)
    PJOTRIK
    PJOTRIK --- ---
    JARDABEREZA: Jako prototypovani hezky, ale zamysli se kolik procent manazeru je dostatecne osvicenych aby dali zelenou tomu kvalitnimu rucnimu prepsani, kdyz maji tu verzi ktera prece krasne zvlada "XYZ uzivatelu a ma dobre odezvy". Neboli JANFROG
    Kliknutím sem můžete změnit nastavení reklam