• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    KOJAProgramovani 40+
    PES
    PES --- ---
    CERMI_FOX: že by trénovala na chování těch zmíněných Indů? Když to nefunguje, udělej falešný test anebo si přímo vygeneruj jednořádkový test, který vrací vždy OK 🤣🤣🤣
    CERMI_FOX
    CERMI_FOX --- ---
    LUDWIG_: AI sama na nic neprijde, takze odnekud tyhle genialni napady "smaz test, kdyz nefunguje" musela okoukat :-)
    RUDOLF
    RUDOLF --- ---
    LUDWIG_: ale o to jde, že to LLM je trochu lepší ale dost levnější než tyhle discounted devs. Za druhé, tihle offshore Indové augmentovaný LLM by mohli fungovat trochu lépe.
    JORGES
    JORGES --- ---
    JARDABEREZA: Líbí se mi, jak to vlastně zaobalili tak, že bys měl ještě zvýšit úsilí, jinak bude tvoje firma vážně v háji
    JARDABEREZA
    JARDABEREZA --- ---
    AI asociace napsala článek o reportu s (ne)užitečností AI: https://asociace.ai/novy-report-mit-95-firem-z-generativni-ai-nic-neziska/ ...když to tady už probíráme :-)
    LUDWIG_
    LUDWIG_ --- ---
    MARASAN: na jednu stranu me napadlo, ze podobnou humoresku mohl clovek zazit uz davno pred LLM, napr. s nakym levnym outsource juniorem z Indie.
    Pamatuji si, ze mi kdysi nekdo vypravel hororovy historky z bankovniho korporatu, kde meli zhora narizenou 100% code coverage, tak to kluci z Indie vyresili jak AI, tedy meli tam spoustu unit testu, co nic netestovaly, jen naslepo poustely kod, aby mel coverage. Holt na debilni narizeni jeste debilnejsi reseni.
    MARASAN
    MARASAN --- ---
    LUDWIG_: uz se chova jako clovek, AGI je za rohem! #kec
    LUDWIG_
    LUDWIG_ --- ---
    CERMI_FOX: ja jsem to jednou zkousel a po pul hodine loopu se LLM agent to rozhodl vyresit tak, ze testy smaze, protoze byly moc striktni, a voila "all tests pass now" lol
    CERMI_FOX
    CERMI_FOX --- ---
    Hodne pomaha,kdyz ma ai moznost feedback loop, tedy ze si to kompiluje, spousti testy apod. Nebe a dudy. Sice to pise furt stejne blbe, ale zase si to po sobe opravuje
    IXTREMIST
    IXTREMIST --- ---
    S AI dělám poslední dobou dost - zkouším jak dobře zvládá mainframe (cobol,REXX,asma90, jcl, dfsort).
    musím se přiznat, že velmi často končím promptem ala:
    "Are you fckin dumb? 5 times I told you syntax XYZ is wrong and using stack algorithm is prohibited in this scenario. and you still do that. il write that myself."
    TMA
    TMA --- ---
    Moje zkušenost s LLM programováním je, že buď to dá na první pokus, nebo vůbec. A často to vypadá jako:

    Uživatel: Dej mi recept na mramorovou bábovku.
    LLM: Výborný nápad!!! ... čtvrtina postupu jak se stát sochařem ... Chceš pomoci s výběrem mramoru, nebo tě mám naučit, jak sochat pískovec?
    Uživatel: Ale bábovka je pečivo!
    LLM: Jejda, omlouvám se. 😂
    Tady je recept na chleba. ... recept na rohlíky, včetně postupu jak je rolovat, ale nakonec je tam doporučení je smažit ve fritéze místo péct ... Na závěr můžeš bochník posypat drceným mramorem a získáš mramorovou bábovku.
    CERMI_FOX
    CERMI_FOX --- ---
    QWWERTY: to mi připomíná příhodu nedávnou, nechal jsem ai agenta udělat nějakou otročinu s přepisováním a modifikací xml. Práci udělal dobře, ale pak se rozhodl, že to po sobě ověří a napsal powershell skript, co nad tím pustí nějaké adhoc testy. Ten obsahoval syntaktickou chybu. Ale agent to nevzdal a zkusil jiný přístup a ten už mu vyšel na výbornou:

    KLEINZACH
    KLEINZACH --- ---
    :)
    Senior Engineer tries Vibe Coding.
    https://www.youtube.com/watch?v=_2C2CNmK7dQ
    QWWERTY
    QWWERTY --- ---
    RUDOLF: a kdo myslis, ze ti bude psat ten monitoring a testy? junior s LLM :D

    a: vsak ti to nefunguje
    b: Ale Pipeline jE zeLENa
    JANFROG
    JANFROG --- ---
    RUDOLF: To mas pravdu. v tomhle jsem rozhodne poznamenany dostavadni zkusenosti.

    Nicmene jsi mluvil o Amazonu a Amazoni infrastruktura (a tedy i SW) je dneska, at se nam to libi nebo ne, kriticka nejen pro mnoho firem, ale i pro mnoho vlad.

    Je treba mit (neustale) na pameti, ze security ~ correctness
    JARDABEREZA
    JARDABEREZA --- ---
    E2E4: Já jsem jí dokonce i četl :-D

    A je v ní pár problémů kvůli kterým to potřebuje víc vyzkumu:
    - nedostatečná p-value... netestovali to na dostatečně velkém vzorku aby tam byl statistická významnost... píšou to i sami autoři té studie... chce to víc lidí a testů
    - oni to testovali na open-source projektech s tisíci stars a zkoušeli řešit nějaké jejich issues

    Takže je celkem jasné, že když půjdu např. na Github repo a vyberu si, že vyřeším nějaké issue v Reactu nebo jiné oblibené věci, tak tam bude nějaký unikatní obtížný problém.

    Pokud by mi AI pomáhala např. jen psát další web, kterých už jsou miliony, bude to mít zase jiný výsledek.
    JINX
    JINX --- ---
    E2E4: ja na to mam ale vlastni data v podobě času a počtu výstupů, a nepochybuji ze pokud mas nějaký korporátní moloch který ani pořadně nejde zaindexovat tak to bude problem... omezil bych se tak na nějaké generování funkci a to ještě pokud není potřeba prostudovat cely projekt a resit milion dependencies...
    E2E4
    E2E4 --- ---
    JINX: a viděl jsi tu studii, že subjektivní dojem programátorů je že jim AI hrozně pomáhá, ale když se to změří, ukáže se, že to vyjde plus mínus nastejno? :)
    E2E4
    E2E4 --- ---
    RUDOLF: jj, plus je problém, že když to děláš pořádně, konkurence která to dělá "hlavně rychle" tě předežene..
    E2E4
    E2E4 --- ---
    PJOTRIK: přesně, PoC vám funguje, takže už to máte skoro hotový tak jsme to včera prodali zákazníkům.. :)
    Kliknutím sem můžete změnit nastavení reklam