TLAMPAC: díky..
btw.. starám se teď o sklizně cz domény, mám tu archiv někde od roku 2005, postupně se zlepšoval.. až budu mít trochu času, pošlu nějak metadata, který máme k dispozici.. nesklízíme facebook, ale blogy apod. máme, vzhledem k zákonu to nemůžeme kompletně zveřejnit, takže jen selektivně.. každopádně, myslím že je legální vytvářet datasety - tj. například URL v kódu staženejch stránek, teprve se do toho dostávám a případně nějaká spolupráce by byla až koncem roku.. tohle je defakto spíš o tom, jestli o to má někdo zájem pro svůj výzkum, nebo si poradí jinak. samotný vedení tohohle projektu je spíš orientovaný nevýzkumně.. a je vůbec otázka jestli na zpřístupnění datasetů budu mít čas v rámci pracovní doby.. takže spíš, hoďte mi paleček jestli vás to někoho zajímá.. případně koment, abych odhadl nějakou úroveň zájmu.