• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    PADSpolecenska media, web X.0, socialni site, jejich analyza, komunity na webu
    PAD
    PAD --- ---
    BECKOU: tohle je hodne sirokej dotaz. facebook dela treba bernie hogan z oii, ale zkusil bych proste google scholar a divej se na to, odkud ty publikace jsou, jak jsou citovane atp. pres citace se pak muzes dostat az nejaktualnejsim zdrojum. jinak jako reference jsou dobre knizky Kleiberg: Networks, Crowds, and Markets (je k dispozici i free preprint na jeho strankach), a obecne o sitich je vyborna Networks: An Introduction od Marc Newmana..
    BECKOU
    BECKOU --- ---
    Zdravim potreboval bych radu, snazim se napsat praci o tom jak mladi travi volny cas a strasne by se mi hodily nejake analyzy socialnich siti, napr vekova struktura, navstevnost apod, facebook primarne. nasmerujete me prosim? prave jsem zacal a nevim od ceho se odpichnout
    BARD
    BARD --- ---
    FRAKTALEK
    FRAKTALEK --- ---
    TSCHIKO: vyborne, diky
    TSCHIKO
    TSCHIKO --- ---
    FRAKTALEK: v Hubu na Andelu byvaji podobne akce
    BARD
    BARD --- ---
    FRAKTALEK: rado se stalo
    FRAKTALEK
    FRAKTALEK --- ---
    BARD: super, wikipedia miner jsem neznal. diky!
    FRAKTALEK
    FRAKTALEK --- ---
    BARD: jasne, chapu

    vidis, na OpenCalais jsem pozapomnel...mozna by to slo nejak chytre pouzit k postaveni vlastniho tezauru
    BARD
    BARD --- ---
    FRAKTALEK: nekde jsme museli zacit, pak uz to jelo samo. byl to prvni set

    Na kategorizaci jsme si museli sami napsat, pro anglictinu je prima zaklad OpenCalais

    FRAKTALEK
    FRAKTALEK --- ---
    BARD: tweety jsou anotovane geo-lokaci? pokud ano, tak asi ne vsechny, ne?


    docela by me zajimalo, jake nastroje mate na kategorizaci. Shanel jsem nejaky tezaurus nebo aspon slovnik zajmu a dovednosti v anglictine, ale nic volne dostupneho jsem nenasel. Nejake komercni moznosti existuji, ale ty jsou momentalne mimo muj dosah.
    BARD
    BARD --- ---
    FRAKTALEK: zacali jsme setem uzivatelu podle toho, ze Twittovali z uzemi CR a SR a indetifikovali, zda si alespon jednou za cas pipnou cesky nebo slovensky. Po tomhle setu jsme uz pak jen crawlovali jejich followery a jejcih followingy a opakovali detekce. V tuhle chvili mame 5 IP adres na WHitelistu Twitteru, takze se to dela vyrazne prijemneji. Na kategorazace mame nastroje, ale nemame zatim cas, protoze se ted soustredime hlavne na Facebook.
    FRAKTALEK
    FRAKTALEK --- ---
    BARD: prozradis, jak jste identifikovali cesky a slovensky twitter?

    Mate ho rozdeleny treba i podle kategorii, napr. zajmu jednotlivych uzivatelu?
    BARD
    BARD --- ---
    at tak nebo tak, jdu do toho
    ALMAD
    ALMAD --- ---
    SATAI: Na druhou stranu, pro nas co kupujeme ebooky, na MBRBG je tam dlouhodoba akce "buy 1, get 1 free".
    SATAI
    SATAI --- ---
    FYI:
    Dnes na http://oreilly.com/ s kodem "DDSCW" za polovic:
    21 Recipes for Mining Twitter, Matthew Russell on Mining the Social Web, Mining the Social Web
    BARD
    BARD --- ---
    PAD: pro vymenu a storovani dat pouzivam GraphML. Pokud jde o db, tak v tuhle chvili vyslovene zadnou graphdb nepouzivam, vyuzivam Redis a Ruby. Nicmene se chystam napsat si nad tim jednoduch DSL, ktere budu postupne podle potreby rozsirovat. Zakladni implementace v Pythonu existuje od nekoho jineho a vali se nekde na Gitu.
    PAD
    PAD --- ---
    FRAKTALEK: jde mi predevsim o interoperabilitu - nekdy potrebuju spis batch processing, tzn. natahnout cely graf do pameti a pak s nim pracovat, jindy potrebuju traverzovani ... momentalne pouzivam JUNG, ale neco v nem chybi a hodilo by se spis Gephi (hlavne na vizualizace) a asi by se hodilo se obcas dotazovat i pres sparql ... momentalne mi prijde jako dobry napad jako api pouzivat ty blueprinty s tim, ze jako backend muze byt treba neo4j nebo sail (sesame rdf store), pripadne to lze vylit do toho xml, ktere zase umi cist gephi. kdybych si napsal adapter blueprints-gephi, tak bych pak mohl pouzivat v podstate cokoliv, co je tak nejak pro javu k dispozici ...

    moje otazka byla minena tak, ze treba nekdo uz neco podobneho resil a treba vi o lepsim zpusobu ...
    FRAKTALEK
    FRAKTALEK --- ---
    PAD: rikal a vysvetlil jsem jak jsem to myslel, viz treba http://www.graph-database.org/implementations/

    nejde o terminologii, jde o ten rozdil a ten je potreba zduraznit

    co se ukladani tyce, tak prece opet jde o to, co s tim chces delat a jake nastroje mas k dispozici. Vzhledem k tomu, ze tu vetsinou zminujes velky site, tak bych si na xml asi dal pozor... pracovat s XML soubory vetsimi nez par desitek MB muze byt neprijemny.
    Kliknutím sem můžete změnit nastavení reklam