• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    PADSpolecenska media, web X.0, socialni site, jejich analyza, komunity na webu
    • Jak vyuzivat data ze spolecenskych medii? Jake jsou nove metody data miningu, analyzy a vizualizace techto dat? Jak je vyuzit? Na co se ptat?
    • Co Vam na soucasnych nastrojich k tomu urcenych, jako napr. Nyx, Twitter, nebo Facebook, vadi, chybi, nebo se naopak libi?
    • Jake jsou nove trendy v teto oblasti? Jak je vyuzit? Jak je zachytit?
    • Jak tyto nove formy komunikace ovlivni spolecnost? Blizime se k ere globalniho mozku? Anebo uz v ni jsme? Bude jednou Internet mysli? Nebo uz ji je? A jsme vubec schopni to z pozice pouheho elementu tohoto systemu vubec zachytit?
    Tahle diskuze by tedy mela byt jak technickeho razeni, tzn. algoritmy dolovani a vizualizace, tak i filozofickeho charakteru, tj. co vsecko to vlastne znamena a kam to smeruje. Snad se tu najde dost lidi s podobnymi zajmy:]
    rozbalit záhlaví
    RUDOLF
    RUDOLF --- ---
    TLAMPAC:

    http://gephi.org/users/requirements/


    Network size
    (nodes + edges) ~Memory suggested
    ~1000 128mo
    ~10,000 512mo
    ~100,000 2go
    ~1M >8go
    PAD
    PAD --- ---
    TLAMPAC: tak velkou sit pujde visualizovat celkem tezko v nejakem beznem programu - muzes zkusit treba Gephi nebo ten Pajek, ale podle mych zkusenosti to je dost pomale pri vetsich grafech ... nakonec jsme zacal pouzivat JUNG (knihovna pro javu), ktera celkem jednoduse umi tvorit obrazky - vyhodou je, ze si pak ty obrazky udelas, jak chces ;)
    TLAMPAC
    TLAMPAC --- ---
    Doporučili byste mi program pro zpracování velke mátice? Ca 100.000 tisíc uzlů, hran počítám do 1 mil. Starý dobrý Pajek k by to měl zvládnout výpočetně, ale jde mi spíše o něco na vizualizaci.
    BARD
    BARD --- ---
    Tipy a triky (převážně) pro Google: Pražská velká koalice a social network analysis
    http://ttgoogle.blogspot.com/2010/11/prazska-velka-koalice-social-network.html
    PAD
    PAD --- ---
    BARD: ted jsem se vratil z kick-off meetingu - no, mame co delat:] ... ale vypada to fakt hodne zajimave;)
    BARD
    BARD --- ---
    PAD: sakra, jak bych rad....
    PAD
    PAD --- ---
    V ramci projektu, pro ktery pracuju, muj sef shani 2-3 PhD studenty (full time stipendium) - zatim ta pozice neni vypsana, ale obecny obrazek lze ziskat na strankach projektu: http://robust-project.eu/ . Jedna se prevazne o ten prvni bod: 'Data mining in online communities'. Vice info rad poskytnu v poste.
    PAD
    PAD --- ---
    FRAKTALEK: to nevim, ale jeste tak pred pul rokem jim to naprosto nefungovalo. ted se zda, ze uz to beha ...

    ad. neo4j: jo, ale stejne to nevyresi problemy s renderovanim tech grafu - napr. FR layout implementaci z JUNG to trva ~5 minut usporadat graf o ~3k nodech a ~100k hran ... pokud to ma bezet dynamicky, tak to nasobis poctem snimku ... pro praci ve stylu gephi nepouzitelne ... kdyby tak nabizeli proste jen api pro vytvoreni videa v davkovem rezimu
    BARD: diky
    FRAKTALEK
    FRAKTALEK --- ---
    PAD: Gephi bylo od zacatku stavene pro dynamicke grafy, ne?

    Co se podpory velkych grafu tyce, tak by se to mohlo vyrazne zlepsit ve verzi 0.8, ve ktere mozna uz stihnout oficialne integrovat grafovou databazi neo4j
    BARD
    BARD --- ---
    PAD: v tom pripade mrkni jeste na https://blog.recordedfuture.com/
    PAD
    PAD --- ---
    BARD: ja myslim, ze to sem patri zcela! diky moc! ... predikce je moc zajimava a zda se, ze v budoucnu spolu s dynamikou siti to bude velmi plodna oblast.

    ten clanek mi pripomnel skutecny minority report, na kterem pracuje US armada: http://edition.cnn.com/2010/US/10/27/pentagon.e.mail.profiling/index.html?eref=rss_us&utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+rss%2Fcnn_us+%28RSS%3A+U.S.%29
    BARD
    BARD --- ---
    http://www.lupa.cz/clanky/minority-report-2-0-nastupuje/ je to trochu napomezi, ale preci jen to sem castecne patri
    PAD
    PAD --- ---
    Autori Gephi zda se odladili podporu pro dynamicke grafy - skoda jen, ze kdyz jsem do toho chtel naladovat sit, se kterou pracuju, tak to zamrzne (pravdepodobne prilis velka:/)

    YouTube - First try at dynamic network visualisation with Gephi
    http://www.youtube.com/watch?v=6rURezjoEDo&NR=1


    Gephi, an open source graph visualization and manipulation software
    http://gephi.org/
    PAD
    PAD --- ---
    EKSRR: zajimave. vypada to (funkcne) jako FF s nekolika pluginy pro ruzne soc. site ... nebo ne?
    EKSRR
    EKSRR --- ---
    tady novej, pomerne velice socialni prohlizec - http://www.rockmelt.com/
    BARD
    BARD --- ---
    PAD: diky, mrknu na to
    TSCHIKO
    TSCHIKO --- ---
    PAD: dik za podporu i za tipy .) jak se jedna o politiku, je to vsechno takovy citlivy :)
    PAD
    PAD --- ---
    PAD: *zmenili (predpokladam aspon jednoho muze:)
    PAD
    PAD --- ---
    TSCHIKO: ja tim myslel to, ze to sice garantujete, ale jen slovne - nad daty mate porad kontrolu vyhradne vy: pokud byste se z pozice benevolentniho spravce zmenily v politickou marketingovou agenturu, tak si uzivatel data neprevede a konkurence tim padem nehrozi. to je imho nejvetsi riziko. jinak ja vam samozrejme fandim v jakemkoliv pokusu rozhybat bahno ceske politiky!;)

    je ironie, ze resite ty fejky: to byl ve skutecnosti muj vyzkumny zamer na ten grant, ktery jsem nedostal: je logicke, ze hijack toho systemu realne hrozi a muze zpusobit velke skody. imho by se to dalo detekovat podobne, jako treba detekce google bombingu, pripadne pomoci data miningu - ti fejkovy uzivatele musi byt v necem jini ... pak uz je to 'jen' o tom napasovat na ne nejakou vhodnou klasifikacni metodu. pripadne i metody SNA by mohly pomoc - pokud existuje vice uctu s podobnymi prolinkovanim (soc. okolim), je pravdepodobne, ze jde o fejk ...
    PAD
    PAD --- ---
    BARD: prima!

    mozna by vas mohly zajimat algoritmy pro detekci overlapping communities - treba od Sune Lehmana vypada dobre: http://www.barabasilab.com/pubs/CCNR-ALB_Publications/201006-21_Nature-LinkCommunities/201006-21_Nature-LinkCommunities.pdf (imho je i volne dostupna implementace v Pythonu)

    vtip je v tom, ze GN vytvori rozklad mnoziny vrcholu, kdezto v socialnich sitich je caste, ze je clovek clenem hned nekolika komunit najednou ... mimoto, GN neni moc presny, pro non-overlapping c. detekci je vhodnejsi Infomap, ktery ( a to je duvod, proc ho mam rad:) detekuje komunity dle simulovaneho toku informaci na siti, takze vysledne komunity jsou celky, kde lide uvnitr komunikuji casto mezi sebou nez navenek, coz je imho z pohledu socialnich ved velmi zajimavy pohled. Rosvall nedavno zverejnil i verzi detekujici hierarchie komunit, takze by to resilo cast vaseho problemu s priliz mnoha nody (jednoduse by jste se nejdrive mohl podivat na higher level pohled) http://www.tp.umu.se/~rosvall/
    TSCHIKO
    TSCHIKO --- ---
    PAD: zneuzitelne je to jen do te miry, do jake to budou zneuzivat sami uzivatele. Porad mame problemy s fejkovymi ucty, zalozenymi jen za ucelem podpory urcite strany nebo politika - ale v nekterych pripadech se tezko posuzuje, jestli to je nebo neni fejk. Kdybyste nekdo mel nejaky ucinny tipy, dejte vedet .)
    Ze strany Deniku politika ale muzu zarucit nezavislost.
    BARD
    BARD --- ---
    Tak jo: Identifikace komunity kolem účtu na Twitteru http://bit.ly/c5OCkx - pro zmenu zase muj prispevek do debaty
    Kliknutím sem můžete změnit nastavení reklam