• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    PADSpolecenska media, web X.0, socialni site, jejich analyza, komunity na webu
    • Jak vyuzivat data ze spolecenskych medii? Jake jsou nove metody data miningu, analyzy a vizualizace techto dat? Jak je vyuzit? Na co se ptat?
    • Co Vam na soucasnych nastrojich k tomu urcenych, jako napr. Nyx, Twitter, nebo Facebook, vadi, chybi, nebo se naopak libi?
    • Jake jsou nove trendy v teto oblasti? Jak je vyuzit? Jak je zachytit?
    • Jak tyto nove formy komunikace ovlivni spolecnost? Blizime se k ere globalniho mozku? Anebo uz v ni jsme? Bude jednou Internet mysli? Nebo uz ji je? A jsme vubec schopni to z pozice pouheho elementu tohoto systemu vubec zachytit?
    Tahle diskuze by tedy mela byt jak technickeho razeni, tzn. algoritmy dolovani a vizualizace, tak i filozofickeho charakteru, tj. co vsecko to vlastne znamena a kam to smeruje. Snad se tu najde dost lidi s podobnymi zajmy:]
    rozbalit záhlaví
    SATAI
    SATAI --- ---
    PAD: Tak to bych asi zkusil najit v Jave (Scale,...) nejakou sikovnou knihovnu a moc to neresil.
    PAD
    PAD --- ---
    SATAI: no, ja R neznam, takze zvazuju, jestli se mi vyplati se jej ucit - a pokud bych musel stejne vse narocne nakonec stejne prepisovat do javy (C v podstate neumim), tak bych byl tam, kde jsem ted:)
    SATAI
    SATAI --- ---
    PAD: Zkusenost mam jen s malym mnozstvim dat. Mas nejaky duvod, proc to nenapsat jako prototyp v R a pak pripadne neoptimalizovat?
    PAD
    PAD --- ---
    Mate nekdo zkusenost s R ( http://www.r-project.org )? Idealne pak s analyzou siti v nem?

    Jsou pro nej dostupne docela sikovne baliky, ale bojim se, ze to nebude moc skalovat. Momentalne pracuju se sitemi s okolo 3k nody, ale budeme ted zpracovavat mnohem vetsi data-set, kde tech nodu budou spis 10ti tisice, mozna i statisice. Navic je ta sit pomerne husta ...

    Zatim si ty analyzy pisu v Jave/Groovy, ale libilo by se mi na to pouzivat neco, co je primo urcene na zpracovani dat - i graficke vystupy se pak budou urcite delat snadnejsi nez v groovy generovat davky pro gnuplot:)
    PAD
    PAD --- ---
    PAD: jo, a na baru maji v Royal Society Budvar!;)
    PAD
    PAD --- ---
    Tak jsem se na WebScience discussion event nakonec dostal, takze jsem o tom neco vyplodil na blog: http://netflux.wordpress.com/2010/10/09/webscience-uk/ .

    Uz se tu diskutovalo, ze je to proste jen marketingovy termin - tak muzu rict, ze momentalne to zrejme bude hodne motivovane prave snahou o ziskani grantu, nicmene myslim, ze tam je velky potencial - ze vseho nejdrive je treba ale celou tu disciplinu lepe definovat a vytvorit solidni metody web science vyzkumu.

    Co jsem na blog nepsal: na te konferenci bylo taky par (imho!) nesmyslnych prispevku: nejaka zenska z INRIA z Francie tam presentovala jako state-of-the-art trojdomenovy model semantiky (lide-tagy-stranky), coz je vec, ktera byla odpublikovana pred X lety Peterem Mikou. Dalsi prispevek o kolektivni inteligenci z dilny nejakeho chlapika z Uni. of Edinbugh jsem nepobral. Naopak prispevek Pierra Levyho - na ktery jsem se tolik tesil - jsem pobral az dost a byla to fakt blbost. Ten clovek proste znovuvynaleza semanticky web. Obecne to bylo ale hodne dobre, hlavne ty prispevky, o kterych se zminuju v tom postu. Behem dvou tydnu by to melo byt vse i online, takze kdo jste nesledoval real-time, muzete zkouknout ze zaznamu. Doporucuju hlavne Jona Kleinberga, Luise von Ahna, Jonathana Zittraina, Jennifer Chayes a Noshir Contractora.
    BARD
    BARD --- ---
    Cisla k blogum nemam v tuhle chvili k dispozic.
    BARD
    BARD --- ---
    BARD
    BARD --- ---
    PAD: indexujeme ceskou a slovenskou cast twitteru (cca 3.6 mega ted), cs Facebooku (cca 20 milino status message) plus ad hoc searche a diskuse pod clanky plus nejaky drobny (forum.lide.cz) 15 milionu. Pokud jde propojeni tak vyuzivame hlavne Social Graph API, ted testujeme nase vlasti SNA.
    PAD
    PAD --- ---
    FRAKTALEK: spatne jsem se vyjadril: mel jsem na mysli spis prohledavani, nez indexovani. nekde musi byt seznam, kam se divat, kde hledat nejaka klicova slova a jaka ... a tam smerovala ta otazka:)
    FRAKTALEK
    FRAKTALEK --- ---
    PAD: cely web ani jeho podstatnou cast temer jiste neindexujou a prijde mi, ze to pro takovouhle sluzbu vubec neni potreba. Taky si ale rad poslechnu vic
    TLAMPAC
    TLAMPAC --- ---
    PAD: vytisknu si a přečtu :)
    PAD
    PAD --- ---
    tohle je, na cem momentalne makam, resp. makal jsem:

    pokud Vam prijde zajimavy Thomas Kuhn a jeho struktura vedeckych revoluci, mohlo by se Vam tohle zdat zajimave taky - ackoli je to stale jeste velmi nedokonale ...

    http://asna.ch/fileadmin/user_upload/2010/Papers/Karnstedt_Paper.pdf
    PAD
    PAD --- ---
    BARD: zajimave. indexujete cely web, nebo nejakou jeho podstatnou cast, nebo proste jen nejakou uzivatelsky definovanou (uzce/zakaznikem) mnozinu? pracujete nejak s komunitami/soc.grafem?
    BARD
    BARD --- ---
    Autonomy ma dve chyby: cenu a pomalost, jinak je to velmi robustni system. My to budeme nabizet jako webou sluzbu, kterou si proste budes platit na mescni platbach.
    TLAMPAC
    TLAMPAC --- ---
    BARD: Zajimavé, nejsem vůbec technik, takže nevím, co je API. Ale zajímalo by mě, jak to budete distribuovat - klientská řešení nebo to bude volně přístupné?

    Mimochodem podobné věci dělá v ČR už více firem. Například Autonomy ve spolupráci s IBA. Jedná se v zásadě o to, že klientům zaindexují některé stránky a na nich sledují, co se o čem šušklo, kdo to řekl, jestli je to pozitivní nebo negativní atd.
    BARD
    BARD --- ---
    tohle zitra ofiko spoustime, vzhledem k tomu, ze je to cele vybavene API, tak myslim, ze to bude davat zajimave podklady http://www.flickr.com/photos/26223481@N03/4970374769/
    TLAMPAC
    TLAMPAC --- ---
    Připojím svou troškou - analýza on-line komunit pomocí SNA:
    http://www.nodeandtie.cz/news/analyza-on-line-komunit/

    FRAKTALEK
    FRAKTALEK --- ---
    PAD: taky jsem zvedavej. Jeden rozdil je, ze v centru kognitivnich ved je mozek, cili konkretni vec, ktere opravdu temer nerozumime. V centru webscience je web, kterymu rozumime docela dobre (v porovnani napriklad s mozkem).

    A jasne, na tom pozorovani o shaneni fundingu neco bude, takovy priklady jsou.. :) (napada me umela inteligence)
    PAD
    PAD --- ---
    FRAKTALEK: je to vsehochut - stejne jako treba kognitivni veda. ale ta si casem vytvorila svoje jasne obrysy. ja cekam neco podobneho i v pripade webscience - ono ve finale to nebude tak obrovsky vsezahrnujici, ale spis bych cekal jasny vliv SNA, vedy o komplexite a zrejme i ekonomie. nechme se prekvapit:)
    --
    treba je to i tak, ze proste je strategicky vyhodnejsi zakladat nove vedecke discipliny, protoze pak je jednodussi sehnat funding;)
    FRAKTALEK
    FRAKTALEK --- ---
    PAD: web science je hrozna vsehochut. Kdyz jsem o tom slysel keynote na ECAI, tak to muj zajem spis snizilo.
    Ale souhlasim s PIZI, ze tam bude spousta zajimavych lidi :)
    Kliknutím sem můžete změnit nastavení reklam