• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    PADSpolecenska media, web X.0, socialni site, jejich analyza, komunity na webu
    • Jak vyuzivat data ze spolecenskych medii? Jake jsou nove metody data miningu, analyzy a vizualizace techto dat? Jak je vyuzit? Na co se ptat?
    • Co Vam na soucasnych nastrojich k tomu urcenych, jako napr. Nyx, Twitter, nebo Facebook, vadi, chybi, nebo se naopak libi?
    • Jake jsou nove trendy v teto oblasti? Jak je vyuzit? Jak je zachytit?
    • Jak tyto nove formy komunikace ovlivni spolecnost? Blizime se k ere globalniho mozku? Anebo uz v ni jsme? Bude jednou Internet mysli? Nebo uz ji je? A jsme vubec schopni to z pozice pouheho elementu tohoto systemu vubec zachytit?
    Tahle diskuze by tedy mela byt jak technickeho razeni, tzn. algoritmy dolovani a vizualizace, tak i filozofickeho charakteru, tj. co vsecko to vlastne znamena a kam to smeruje. Snad se tu najde dost lidi s podobnymi zajmy:]
    rozbalit záhlaví
    BARD
    BARD --- ---
    PAD: pro vymenu a storovani dat pouzivam GraphML. Pokud jde o db, tak v tuhle chvili vyslovene zadnou graphdb nepouzivam, vyuzivam Redis a Ruby. Nicmene se chystam napsat si nad tim jednoduch DSL, ktere budu postupne podle potreby rozsirovat. Zakladni implementace v Pythonu existuje od nekoho jineho a vali se nekde na Gitu.
    PAD
    PAD --- ---
    FRAKTALEK: jde mi predevsim o interoperabilitu - nekdy potrebuju spis batch processing, tzn. natahnout cely graf do pameti a pak s nim pracovat, jindy potrebuju traverzovani ... momentalne pouzivam JUNG, ale neco v nem chybi a hodilo by se spis Gephi (hlavne na vizualizace) a asi by se hodilo se obcas dotazovat i pres sparql ... momentalne mi prijde jako dobry napad jako api pouzivat ty blueprinty s tim, ze jako backend muze byt treba neo4j nebo sail (sesame rdf store), pripadne to lze vylit do toho xml, ktere zase umi cist gephi. kdybych si napsal adapter blueprints-gephi, tak bych pak mohl pouzivat v podstate cokoliv, co je tak nejak pro javu k dispozici ...

    moje otazka byla minena tak, ze treba nekdo uz neco podobneho resil a treba vi o lepsim zpusobu ...
    FRAKTALEK
    FRAKTALEK --- ---
    PAD: rikal a vysvetlil jsem jak jsem to myslel, viz treba http://www.graph-database.org/implementations/

    nejde o terminologii, jde o ten rozdil a ten je potreba zduraznit

    co se ukladani tyce, tak prece opet jde o to, co s tim chces delat a jake nastroje mas k dispozici. Vzhledem k tomu, ze tu vetsinou zminujes velky site, tak bych si na xml asi dal pozor... pracovat s XML soubory vetsimi nez par desitek MB muze byt neprijemny.
    PAD
    PAD --- ---
    a vubec - me to privadi k otazce: co pouzivate/jestli pouzivate na ukladani siti? nejaky spolecny format jako graphml? nebo (jako ja momentalne) je proste ukladate do relacni databaze? pripadne nejake grafove db?

    ptam se proto, ze zacinam pocitovat potrebu mit nejaky jednotny format, se kterym budu pracovat ... premyslim o graphml, protoze je to xml, ktery se ztransformovat v pripade potreby, a je podporovano Blueprints (neco jako JDBC pro grafove databaze), takze pak ty grafy by sly i naloadovat do nejakych triplestoru, neo4j apod...
    PAD
    PAD --- ---
    FRAKTALEK: neni. druha veta mluvi o triple storech jako o specializovanych graph databases, coz je treba i ta jena sdb/tdb, o kterych jsi rikal, ze grafovymi databazemi nejsou.
    --

    uprimne receno, myslim, ze je to uplne jedno. muzeme si kazdy myslet, ze grafova databaze je treba i tuzka a papir, kdyz na to prijde; podstatne spis je, co vlastne BARD chtel delat s grafama, ze se ptal na databazi? ukladat ten twitri cs/sk graf?;)
    FRAKTALEK
    FRAKTALEK --- ---
    PAD: myslim, ze to je konzistentni s tim, co rikam:

    "A graph database is a database that uses graph structures with nodes, edges, and properties to represent and store information. "
    PAD
    PAD --- ---
    samozrejme na to muzes (a zjevne mas) jinej nazor:
    "A graph database is a database that uses graph structures with nodes, edges, and properties to represent and store information. General graph databases that can store any graph are distinct from specialized graph databases such as triplestores and network databases."

    Graph database - Wikipedia, the free encyclopedia
    http://en.wikipedia.org/wiki/Graph_database
    PAD
    PAD --- ---
    PAD: sorry. mel jsem na mysli, ze pokud to omezis na traversing, pak neni graph database, samozrejme (ackoliv s tim nesouhlasim)

    jena nepouziva jen relacni databazi (mrkni na TDB) - a higher level api je v podstate stejne (dostanes implementaci Model/u)

    SPARQL je taky "v podstate jen" high level pohled na RDF data... - no a? muj point je proste to, ze at uz pouzivas traversing, nebo pattern matching, porad muzes mluvit o grafove databazi - jde jen o to, co potrebujes resit
    FRAKTALEK
    FRAKTALEK --- ---
    PAD: teda ty mas zajimavy definice. RDF store je proste neco, kam jdou ukladat RDF data "An RDF store (or triple store) is a system for storing and managing RDF data," http://semanticweb.org/wiki/Category:RDF_store cili Jena urcite RDF store je at je to s traversingem jak chce.

    SPARQL je taky "v podstate jen" high level pohled na RDF data...

    A jasne, traversing v Jene je pomalej prave proto, ze jena pouziva relacni databazi. Prave proto do toho tady rejpu... Z tohoto pohledu jde totiz o dve ruzne urovne - ta bliz fyzicke vrstve, kde jsou relacni databaze a treba neo4j a kam pro me patri i pojem (opravdove) grafove databaze a pak ta vyssi vrstva systemu typu RDF triple storu (Jena, Sesame, ...), a jinych (InfoGrid, ...), ktere vetsinou pouzivaji nejaky system z te prvni urovne.
    PAD
    PAD --- ---
    FRAKTALEK: pokud definici zusis na traversing, pak jena neni rdf store - zkousel jsem to a je to neuveritelne pomale:)

    pattern matching mam na mysli prave sparql - gremlin je v podstate 'jen' high level pohled na pipes/traversing. oboje ma svoje pro a proti - sparqlem muzes pristupovat a dotazovat se rdf grafu jako by to byla relacni databaze, u traversovani zas muzes rychle provadet nektere druhy inferenci (ruzne closures jako coauthorship apod. ..)
    FRAKTALEK
    FRAKTALEK --- ---
    PAD: no nevim..to je trochu moc siroka definice, ja beru grafovou databazi jako typ nosql databaze, ktera je optimalizovana prave pro traversing. A pro traversing neni neo4j lepsi asi ale urcite.

    U pattern matchingu asi zalezi, co mas presne na mysli. Pokud vim, tak treba SPARQL ma v tomhle ohledu dost omezeny moznosti a daleko vhodnejsi by asi byly ruzne RDF Path jazyky, ktery zase bezne nejsou implementovany. A na druhou stranu, pro neo4j existuje treba ten Gremlin...nezkousel jsem, ale v tom asi pujde udelat hodne.

    Podle me, pro implementaci grafovych algoritmu (DFS, BFS, jakykoliv jiny traversing) je jednoznacne lepsi Neo4j nez Jena, ktera pokud vim pouziva relacni databaze (in memory nepocitam, tam si muze delat kdo chce co chce, o tom se nebavime).
    PAD
    PAD --- ---
    FRAKTALEK: jasne, je to vec terminologie. RDF je graf, databaze, ktera uklada graf, je grafova databaze, Jena story (RDB, SDB, TDB) ukladaji RDF, takze jsou grafove databaze. prijde na to, jaky graf ma clovek na mysli a co s nim chce delat (pattern matching - vetsinou lepsi RDF story, traversing - asi lepsi Neo4J apod.)
    FRAKTALEK
    FRAKTALEK --- ---
    PAD: Jenu bych nepocital mezi grafove databaze
    FRAKTALEK
    FRAKTALEK --- ---
    BARD: s neo4j, ale spis jednodussi veci
    PAD
    PAD --- ---
    BARD: mam, trochu s neo4j, a vetsi s Jena SDB (RDF store)
    BARD
    BARD --- ---
    Mate nekdo nejake zkusenosti s nejakou GraphDB? Jde mi o to, ze seznam ceskych a slovneskych Twitter uctu mi prijde jako prima zacatek pro datamining Google Social Graph API a s tim nastupem otazek typu okolni kamaradi, vazby mezi blogy a podobne.
    BARD
    BARD --- ---
    Nastesti mam virtualni masinu s Linuxem, ale ten cas nemam:-(
    RUDOLF
    RUDOLF --- ---
    BARD: mně to při prvních pokusech z osx házelo seg.fault.. což není dobrá zpráva.
    BARD
    BARD --- ---
    pocitam, ze s k tomu dostanu pred Berlinem
    RUDOLF
    RUDOLF --- ---
    BARD: to vypadá luxusně!
    BARD
    BARD --- ---
    PAD: vypada to tak, krom toho by si to prej melo poradit i s velkejma sitema
    PAD
    PAD --- ---
    BARD: nebylo a uz jsem na to narazil, ale nejak sem na prvni pohled (letmy, pravda) nepochopil, v cem spocivaji vyhody ... ale musim se na to mrknout poradne. ten tym se zda hodne silny ve vizualizaci komplexnich systemu ...
    BARD
    BARD --- ---
    PAD: tak celej ceskej a slovenskej twitter neco zaber:-) Btw: tohle tu bylo? http://mkweb.bcgsc.ca/linnet/img/network-communities.png Vubec ty stranky vypadaj dobre: http://mkweb.bcgsc.ca/linnet/
    PAD
    PAD --- ---
    BARD: to je pekne husta sit! nedavno jsem vyzkousel gephi na macu a site, ktere mi pod linuxem trvalo vyrenderovat vecnost byly hotove za par sekund (okol 3k uzlu, asi 100k hran). tak treba by to slo i s vetsimi sitemi. pokud ne, tak pak uz asi jedine neco napsat - pokud nechces vyslovene neco hackovat v cecku nebo jave, tak doporucuje se podivat na R a balik igraph. pripadne exituje i pro python, ale v R jsem behem asi 30 minut byl schopny sit natahnout do pameti a vyrenderovat - zkratka je to spis prostredi urcene pro statistiky prip. spolecenske vedce, nez pro vyvoj aplikaci.
    BARD
    BARD --- ---
    TLAMPAC: ano, bohuzel ano
    TLAMPAC
    TLAMPAC --- ---
    BARD: musí to být freeware?
    BARD
    BARD --- ---
    Nejaky tip v cem vizualizovat site o 25.000 node s cca megem hran? (CS Twitter)
    SATAI
    SATAI --- ---
    PAD: Maji tam ted neco jako zony, kde muzes vybrat oblasti, ktere te zajimaji. Ale mam dojem, ze to jeste nemaji dotazene.
    PAD
    PAD --- ---
    SATAI: zajimave. zajimalo by me, jak hodlaji resit to presmerovavani memu - aby mi nechodili napr. napady na prodej kabelek, v cemz se vubec nevyznam ... jinak zajimavy vzhled a vubec originalni!;)
    SATAI
    SATAI --- ---
    Co rikate na MemeReactor? Napad na asocialni sit se mi dost libi, ale porad nevim, zda to bude zajimave i v praxi. Prozatim davam body za originalitu.
    memeReactor - asocial network
    http://www.memereactor.com/what-is-meme-reactor.jsp
    NEOPHONIC
    NEOPHONIC --- ---
    Ahoj, je to poněkud paradox, ale toto je můj první příspěvěk do nyxu.
    Rád bych, v případě že tu jsou lidé z neziskových organizací, nabídl zdarma k užití a dalšímu společnému rozvoji, komunikační platformu na bázi sociální sítě.
    Z právního hlediska jsme sice akciová společnost, nicméně já sám jsem původem z neziskového sektoru a chtěl bych vyjádřit podporu občanským iniciativám v ČR a na Slovensku.

    Pokud jsou tu nadšenci, kteří by se rádi zapojili do tvorby koncepce dalšího rozvoje původně Slovensko-České komunikační platformy, prosím následujte internetový odkaz
    inQool – komunikační platforma pro neziskovky « Lidé a kultura
    http://blogy.konekuto.eu/lide-a-kultura/2011/01/17/inqool-komunikacni-platforma-pro-neziskovky/

    Jménem občanského sdružení KONEKUTO a inQool.cz se budu těšit na vaše odpovědi. Na tomto poli je spousta výzev, hledáme spojence.

    Díky!

    BTW, k předchozí diskusi: Znáte někdo Skyrails? Zajímavej počin. Dá se to vyhledat na ytube. Pokud už to v diskusi bylo, omlouvám se:)

    Kliknutím sem můžete změnit nastavení reklam