• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    RUDOLFMachine Learning | Strojové učení | In Machines We Trust | Víra v mechanickou bestii
    MART1NKA
    MART1NKA --- ---
    CUCHULAIN: Jee potešil si :). Lematizér češtiny sa dá vyriešiť nástrojom of ÚFALu, ktorý tiež dodáva Geneea. Na komerčné účely najľahšou cestou so mnou v pošte. http://ufal.mff.cuni.cz/morphodita Má ale jednu vadu, je to robené na prehistorickom korpuse. Ak to má byť language independent, môžeme poskytnúť konzultáciu.
    JINX
    JINX --- ---
    KYRKYJ: Potrebuju na jedne siti naucit X datasetu, zajima me jenom co nejvetsi variabilita.
    KYRKYJ
    KYRKYJ --- ---
    JINX: ImageNet je největší dostupný dataset na klasifikaci, je to standart. Záleží o co se pokoušíš / co tvůj model má umět. Pokud je to klasifikace na co největším datasetu, tak nic lepšího než ImageNet neseženeš, pokud máš nějaký jiný cíl, tak záleží co konkrétně chceš.
    JINX
    JINX --- ---
    Mate nekdo tip na podobne kvalitni dataset jako MS-COCO ale vhodny pro klasifikaci? (Zkousim ImageNet ale ty obrazky se mi moc nelibi).
    CUCHULAIN
    CUCHULAIN --- ---
    TUSIL: třeba tutaj pražáci :)
    Geneea - Text Analytics
    https://www.geneea.com/
    demo - https://demo.geneea.com/

    nebo sám. já to řešil přes TensorFlow + Keras + bow. akorát je potřeba vyřešit lematizaci slov.
    TUSIL
    TUSIL --- ---
    Ahoj, snazim se najit nejaky zpusob, jak ziskat informace o tiskovych zpravach, ktere mi dorazi emailem a napadla me cesta ML, se kterym ale nemam moc zkusenosti. Cilem je zjistit nasledujici:
    • ktere spolecnosti se tiskova zprava tyka
    • produkt/sluzba/udalost ktere se tyka
    • rozdeleni prichozi zpravy na casti, ze kterych se bezne sklada (nazev, obsah, informace o spolecnosti, kontakty pro novinare atd), ale v kazdem emailu je to trochu jinak

    Co jsem se snazil googlit, tak jako nejzajimavejsi mi prisla sluzba Amazon Comprehend, protoze jsem vyvojar, ktery nema moc zkusenosti s ML. Bohuzel ale neni dostupna pro cestinu, takze predpokladam, ze budu muset jit do ML a napadlo me, ze bych se tu zeptal, jestli by me nekdo nemohl nasmerovat kudy se vydat?:) Diky
    SOPTIK
    SOPTIK --- ---
    JINX: Ja byl minuly rok, letos mi to nevyjde z casovych duvodu, jinak bych sel. Mne se minuly rok prednasky libily, kazdopadne letos je vetsi tlak na to, aby prispevky byly vice odborny, tak jsem zvedavy.
    PJOTRIK
    PJOTRIK --- ---
    JINX: Trochu necekane tam budu, tak by bylo fajn se s nekym potkat
    JINX
    JINX --- ---
    PJOTRIK: Byl jsem tam minuly rok a letos to asi vynecham. Proc se ptas?
    PJOTRIK
    PJOTRIK --- ---
    Chystate se nekdo na ML Prague v unoru?
    SAL2040
    SAL2040 --- ---
    má tu prosím někdo zkušenosti s n-gramovými modely? potřeboval bych poradit s iplementací Kneser-Nay smoothing.
    klidně do pošty.
    DAVESADE
    DAVESADE --- ---
    Nemel by nekdo zajem o koupi AWS Deep Racer? Ofiko v prodeji od brezna 2019, ale vyhral jsem v soutezi dev kousek a nemam pro nej prakticke vyuziti.
    HANT
    HANT --- ---
    Humble Book Bundle: Machine Learning by O'Reilly (pay what you want and help charity)
    https://www.humblebundle.com/...8_08_27_essentialknowledge_bookbundle&linkID=&utm_content=cta_button
    P0CIN
    P0CIN --- ---
    SH_PANDA: samozrejme bych rad, ale podle SZ se ukazuje ze to tak uplne neni binarni klasifikace zprav tykajici se politky (doufal jsem v neco pikantniho tykajici se Babis/SPD vs normalni lidi :-))) )
    ale je to neco krapet komplikovanejsi, takze na to spise nebudu mit kapacitu
    MART1NKA
    MART1NKA --- ---
    ZONICEK: Záleží na viac faktoroch. Ak vieš trošku robiť s pythonom, môžem poprípade poskytnúť nejaké vzorové notebooky na sentiment. Napíš mi do pošty. Chcela by som nejaké zmysluplné dáta a je možnosť, ak máš teda čas a nepotrebuješ to zajtra, že by som ti to urobila za symbolickú cenu v rámci vlastného vzdelávania.
    SH_PANDA
    SH_PANDA --- ---
    P0CIN: Kdyz je to pro neziskovku neudelas to na githubu pro dobre vsech? ;)
    ZONICEK
    ZONICEK --- ---
    P0CIN:
    Něco na pomezí vědy a výzkumu :) pošlu ti to do SZ.
    P0CIN
    P0CIN --- ---
    ZONICEK: nejvice asi zalezi v jakem formatu mas data, jejich priprava vetsinou zabere nejvice casu + jaka presnost je pro tebe dostacujici. Daji se pak honit vpodstate desetinky procent v presnosti, ale... :-)

    Nejstem teda expert na NLP, ale takovy jednoduchy standard vuci kteremu se casto porovnavaji slozitejsi metody je naive bayes classifier - ten se da nastavit vpodstate za odpoledne. Podle toho jak vyjde tohle se pak da rozhodnout jestli ma smysl zkouset neco sofistikovanejsiho.

    Mas to pro nejakou neziskovku (to bych mohl zkusit ve volnych chvilich neco vyexperimentovat), nebo to je normalni komercni problem?
    ZONICEK
    ZONICEK --- ---
    SH_PANDA: diky a jeste prosim o jeden odhad. Vsude jsou pak ceny ua zpravovani, ale kolik by tento priklad stal cca naprogramovat? V podstate na zaklade x tisic zprav kde vim ze jde o pozitivni nebo negativni vzrah (data v excelu) a k tomu dalsich x tisic bez prirazeni. Diky
    SH_PANDA
    SH_PANDA --- ---
    ZONICEK: ano
    Kliknutím sem můžete změnit nastavení reklam