• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    PADSpolecenska media, web X.0, socialni site, jejich analyza, komunity na webu
    • Jak vyuzivat data ze spolecenskych medii? Jake jsou nove metody data miningu, analyzy a vizualizace techto dat? Jak je vyuzit? Na co se ptat?
    • Co Vam na soucasnych nastrojich k tomu urcenych, jako napr. Nyx, Twitter, nebo Facebook, vadi, chybi, nebo se naopak libi?
    • Jake jsou nove trendy v teto oblasti? Jak je vyuzit? Jak je zachytit?
    • Jak tyto nove formy komunikace ovlivni spolecnost? Blizime se k ere globalniho mozku? Anebo uz v ni jsme? Bude jednou Internet mysli? Nebo uz ji je? A jsme vubec schopni to z pozice pouheho elementu tohoto systemu vubec zachytit?
    Tahle diskuze by tedy mela byt jak technickeho razeni, tzn. algoritmy dolovani a vizualizace, tak i filozofickeho charakteru, tj. co vsecko to vlastne znamena a kam to smeruje. Snad se tu najde dost lidi s podobnymi zajmy:]
    rozbalit záhlaví
    FRAKTALEK
    FRAKTALEK --- ---
    SALAM
    SALAM --- ---
    SPRINGI
    SPRINGI --- ---
    jake prosim doporucujete soc. site pro prezentaci muziky mimo - FB, hyves, stumble, myspace, youtube, twitter...ja jen jestli jsem na neco nezapomnel a nebo jestůli si nevyvrbilo neco noveho.
    dekuji
    TSCHIKO
    TSCHIKO --- ---
    Sociální síť specializovaná na politiku:

    http://www.denikpolitika.cz/
    PAD
    PAD --- ---
    Zacal jsem psat (doufam ze pravidelnou) sekci o novinkach v oblasti, na kterou je tato diskuze zamerena. Je to spis takovy muj zapisnik, kde si sumarizuju, co se stalo a co to znamenalo, ale treba to nekomu z Vas prijde uzitecne nebo zajimave. Prvni "dil" je tam: http://netflux.wordpress.com/2010/10/16/complexity-crumblenaut-1/
    PAD
    PAD --- ---
    samozrejme to muzu zparalelizovat i v jave pres vlakna, ale actor model v scale mi prijde jednodusi, takze bych to asi i rychleji odladil - nejvetsi vyhodou je ale imho funkcionalni pristup ke kolekcim - pri tom graph miningu clovek porad zondluje s vektory a delat tohle v ciste jave je fakt v*ser:] ... a prave tohle se mi zda, ze je i v R celkem vyresene (prace s vektory)
    PAD
    PAD --- ---
    SATAI: jj, scalu se tak nejak po vecer uz sprtam:) vypada to, ze uz z nazvu by mela lepe skalovat;) - napriklad analyza deseti time-slices site s prumernym poctem nodu 2200 a asi 80k hran trva na mym laptopu asi 8 hodin. napsano je to v jave (jung knihovna). kdyz to prepisu do scaly a pustim pres 16 XEON jader, tak si myslim, ze to bude pod hodinu.

    me na tom R zaujalo krome tech balicku (RSIENA, iGraph) i to, ze to pak muzes rovnou zvizualizovat. taky se zda, ze ma pokrocile numericke ficurky ... ale na to by se v jave asi nasly knihovny ... tak se asi holt naucim prvni poradne scalu:)
    SATAI
    SATAI --- ---
    PAD: Tak to bych asi zkusil najit v Jave (Scale,...) nejakou sikovnou knihovnu a moc to neresil.
    PAD
    PAD --- ---
    SATAI: no, ja R neznam, takze zvazuju, jestli se mi vyplati se jej ucit - a pokud bych musel stejne vse narocne nakonec stejne prepisovat do javy (C v podstate neumim), tak bych byl tam, kde jsem ted:)
    SATAI
    SATAI --- ---
    PAD: Zkusenost mam jen s malym mnozstvim dat. Mas nejaky duvod, proc to nenapsat jako prototyp v R a pak pripadne neoptimalizovat?
    PAD
    PAD --- ---
    Mate nekdo zkusenost s R ( http://www.r-project.org )? Idealne pak s analyzou siti v nem?

    Jsou pro nej dostupne docela sikovne baliky, ale bojim se, ze to nebude moc skalovat. Momentalne pracuju se sitemi s okolo 3k nody, ale budeme ted zpracovavat mnohem vetsi data-set, kde tech nodu budou spis 10ti tisice, mozna i statisice. Navic je ta sit pomerne husta ...

    Zatim si ty analyzy pisu v Jave/Groovy, ale libilo by se mi na to pouzivat neco, co je primo urcene na zpracovani dat - i graficke vystupy se pak budou urcite delat snadnejsi nez v groovy generovat davky pro gnuplot:)
    PAD
    PAD --- ---
    PAD: jo, a na baru maji v Royal Society Budvar!;)
    PAD
    PAD --- ---
    Tak jsem se na WebScience discussion event nakonec dostal, takze jsem o tom neco vyplodil na blog: http://netflux.wordpress.com/2010/10/09/webscience-uk/ .

    Uz se tu diskutovalo, ze je to proste jen marketingovy termin - tak muzu rict, ze momentalne to zrejme bude hodne motivovane prave snahou o ziskani grantu, nicmene myslim, ze tam je velky potencial - ze vseho nejdrive je treba ale celou tu disciplinu lepe definovat a vytvorit solidni metody web science vyzkumu.

    Co jsem na blog nepsal: na te konferenci bylo taky par (imho!) nesmyslnych prispevku: nejaka zenska z INRIA z Francie tam presentovala jako state-of-the-art trojdomenovy model semantiky (lide-tagy-stranky), coz je vec, ktera byla odpublikovana pred X lety Peterem Mikou. Dalsi prispevek o kolektivni inteligenci z dilny nejakeho chlapika z Uni. of Edinbugh jsem nepobral. Naopak prispevek Pierra Levyho - na ktery jsem se tolik tesil - jsem pobral az dost a byla to fakt blbost. Ten clovek proste znovuvynaleza semanticky web. Obecne to bylo ale hodne dobre, hlavne ty prispevky, o kterych se zminuju v tom postu. Behem dvou tydnu by to melo byt vse i online, takze kdo jste nesledoval real-time, muzete zkouknout ze zaznamu. Doporucuju hlavne Jona Kleinberga, Luise von Ahna, Jonathana Zittraina, Jennifer Chayes a Noshir Contractora.
    BARD
    BARD --- ---
    Cisla k blogum nemam v tuhle chvili k dispozic.
    BARD
    BARD --- ---
    BARD
    BARD --- ---
    PAD: indexujeme ceskou a slovenskou cast twitteru (cca 3.6 mega ted), cs Facebooku (cca 20 milino status message) plus ad hoc searche a diskuse pod clanky plus nejaky drobny (forum.lide.cz) 15 milionu. Pokud jde propojeni tak vyuzivame hlavne Social Graph API, ted testujeme nase vlasti SNA.
    PAD
    PAD --- ---
    FRAKTALEK: spatne jsem se vyjadril: mel jsem na mysli spis prohledavani, nez indexovani. nekde musi byt seznam, kam se divat, kde hledat nejaka klicova slova a jaka ... a tam smerovala ta otazka:)
    FRAKTALEK
    FRAKTALEK --- ---
    PAD: cely web ani jeho podstatnou cast temer jiste neindexujou a prijde mi, ze to pro takovouhle sluzbu vubec neni potreba. Taky si ale rad poslechnu vic
    TLAMPAC
    TLAMPAC --- ---
    PAD: vytisknu si a přečtu :)
    PAD
    PAD --- ---
    tohle je, na cem momentalne makam, resp. makal jsem:

    pokud Vam prijde zajimavy Thomas Kuhn a jeho struktura vedeckych revoluci, mohlo by se Vam tohle zdat zajimave taky - ackoli je to stale jeste velmi nedokonale ...

    http://asna.ch/fileadmin/user_upload/2010/Papers/Karnstedt_Paper.pdf
    PAD
    PAD --- ---
    BARD: zajimave. indexujete cely web, nebo nejakou jeho podstatnou cast, nebo proste jen nejakou uzivatelsky definovanou (uzce/zakaznikem) mnozinu? pracujete nejak s komunitami/soc.grafem?
    BARD
    BARD --- ---
    Autonomy ma dve chyby: cenu a pomalost, jinak je to velmi robustni system. My to budeme nabizet jako webou sluzbu, kterou si proste budes platit na mescni platbach.
    Kliknutím sem můžete změnit nastavení reklam