• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    PANTARILDistribuované vyhledávací systémy - YaCy, FAROO a další. Pojďme postavit otevřenou a necenzurovanou variantu Googlu.
    XCHAOS
    XCHAOS --- ---
    dnes mi to spadlo, nová verze přitom uvolněná nebyla, po prostém restartu se to chytlo
    PANTARIL
    PANTARIL --- ---
    XCHAOS: me to zatim taky drzi.. jakou ze to mas tu verzi? ja mam 0.99/7455 (viz zalozka system update v administraci)
    XCHAOS
    XCHAOS --- ---
    Tak dneska reinstalovaný Yacy prozatím drží a vrací relativně zajímavější výsledky než dříve... ale nevím čím to je, ale počet dostupných nodů mi zase klesl někam k hodnotě 60 a počet dostupných stránek pod 1 miliardu. mám několik teorií... jedna z nich je, že ten program je prostě pořád příliš náročný péči administrátora... a i když po po vlně zájmu v důsledku zpráv o cenzurování výsledků Googlu počet nodů krátkodobě vzrostl, tak bohužel celková nepraktičnost toho programu většinu z těchto zvědavých betatesterů zase odradila.

    Každopádně se zdá, že lokální dotazy mají vliv na DHT transfer i Remote crawling, pokud to někoho zajímá po technické stránce.
    XCHAOS
    XCHAOS --- ---
    jinak http://teckacz.arachne.cz:8080/ snad už dneska nepadá, takže koho to odradilo včera, tak může testovat.
    XCHAOS
    XCHAOS --- ---
    Tak tohle mě fakt u nové verze příjemně překvapilo - zatímco dříve v téhle statistice byly nesmysly, tak teď ke mě DHT ukládá hashe z domén, které skutečně mají nějaký informační obsah. (možná to má souvislost s dotazy, které předtím vzešly z mého node ?)

    3) Results for Index Transfer

    The url fetch was initiated and executed by other peers. These links here have been transmitted to you because your peer is the most appropriate for storage according to the logic of the Global Distributed Hash Table.

    Statistics about 100 domains in this stack:
    Domain URLs
    de.wikipedia.org 20018
    www.mininova.org 17506
    en.wikipedia.org 12271
    www.sciencedaily.com 10426

    VOZKA: hustý... to ovšem může být prostě jen nepodepsaný https:// content uvnitř IFRAME... to je celkem normální...
    VOZKA
    VOZKA --- ---
    NEKROMANT: Tento rámec byl blokován, protože obsahuje určitý nezabezpečený obsah.
    NEKROMANT
    NEKROMANT --- ---
    XCHAOS
    XCHAOS --- ---
    PANTARIL: já nakonec celý balík odinstaloval (apt-get remove) a pak znovu nainstaloval. zajímavé je, že teď je to (po promazání všech dat nahromaděných za nekolik měsíců) výrazně rychlejší. (ale paměť už tomu zase stačila dojít :-) ale zafungoval restart přes web, což v mi předchozí instalované verzi nešlo)

    akorát jsem node musel přejmenovat - jméno teckacz je už natrvalo zabrané tou původní instalací, kterou jsem ale smazal :-)
    PANTARIL
    PANTARIL --- ---
    XCHAOS: jo tak se mi to pres noc dostalo do podobneho stavu, java proces bezel, ale nepsal nic do logu, nesel slusne sestrelit a requesty samozrejme nespracovaval. Musel jsem ho nasilne killnout a znovu spustit.

    S takovou to moc nema smysl pouzivat, zkusim updatovat na nejnovejsi verzi pomoci toho jejich auto-updatu a pokud to nepomuze, tak par tydnu / mesicu pockam, nez se to dostane do stavu, kdy to aspon nebude padat.
    XCHAOS
    XCHAOS --- ---
    hmm, tak po reinstalaci mi to běží, ale zdá se, že se mi nedaří můj node přejmenovat, ani znovu nastavit vyhledávání mimo rámec výchozí domény...
    XCHAOS
    XCHAOS --- ---
    doháje... tak teď mi to už nejde používat vůbec, ten Yacy (ale přitom samotný proces běží...)
    XCHAOS
    XCHAOS --- ---
    hele, žádná chyba dohledat nelze... občas to běží, ale nepřijímá webová spojení na management portu, občas je to hrozně pomalý, občas to prostě spadne a leží, a občas tomu "oficiálně" dojde paměť, což je debilní, protože to zakáže DHT transfery, a bez DHT transferů nesmí tvoji návštěvníci webu dávat globální dotazy (a ani si nevšimnou, že se ptají jen lokálně... což jsou výsledky nahouby)

    běží mi to celkem na nějaké plečce, na Linuxu 32bit. asi je probém málo RAM. ale počkej, až ti naroste ta cache na disku... taky ti to začne padat.
    PANTARIL
    PANTARIL --- ---
    XCHAOS: Zajimave, me to zatim nespadlo (ale uptime mam zatim jen cca 5 hodin:).

    Na cem to provozujes? Ja mam Sun/Oracle jre 6u23-3 na 64bit linuxu. Pouzivas tu zabudovanou automatickou aktualizaci?

    A kvuli cemu (s jakou chybou) ti to pada?
    XCHAOS
    XCHAOS --- ---
    jinak v souvislosti tím, že je odkaz na tento klub na titulní stránce NYXu, mi dnes můj Yacy node padá prakticky každých pět minut. doporučuji den dva počkat... ono když se na tom vyhledávači sejdou dva uživatelé současně, tak to obvykle okamžitě spadne :-) (říkám, že bych to chtěl přesat do čistého céčka... )
    XCHAOS
    XCHAOS --- ---
    moje články dotýkající se nějak tématu P2P search (tag YaCy) zde:

    TečkaCZ
    http://teckacz.cz/tag/Yacy

    nejstarší je přehnaně nadšený... potom je tam obecný článek o tom, že diskriminované P2P není zdaleka jenom o Bittorrentu jiném filesharingu, no a nakonec je tam aktuální článek ze dneška, s komentáři čtenářů.

    jinak je pravda, že počet pro mě dostupných nodů Yacy, který se odpoledne pohyboval až přes stovku, klesl na 81 (ale možná je to dané nízkým výkonem mého node ? podle jiných zdrojů jsou běžících nodů stovky - ale není mi jasný algoritmus, který rozhodne o tom, který node vidí kolik jiných aktivních nodů...).

    co se zkušeností ostatních userů týče, tak vyjadřuji svůj hluboký respekt všem, kteří to udrží delší dobu v chodu: vím minimálně o dvou lidech (shodou okolností oba z České Pirátské Strany), kteří to velmi rychle vzdali.

    pro provoz výkonného serveru, dedikovaného POUZE na distribuovaný search, bych asi byl schopen zajistit u nás ve firmě housing - víceméně, momentálně mi volný server nepřebává (a ještě pár týdnů nebude).

    soustředit se na svobodný distribuovaný search mě přijde jako inteligentnější krok, než (dejme tomu) slepě provozovat celkem přímočaře zneužitelnou věc typu Tor.
    PANTARIL
    PANTARIL --- ---
    Ja jsem se dnes rozhodl reagovat na cenzuru vyhledavani torrentu, kterou spustil google. Nainstaloval jsem si YaCy na adrese https://yacy.kalevala.cz/.

    Nastaveni je vesmes vychozi, zatim nemam spusteny ani crawler.

    Uvitam jakekoliv rady, jak moji instaklaci nodu vylepsit. Taky by se hodily reference na alternativy k YaCy. Existuji vubec nejake pouzitelne?
    PANTARIL
    PANTARIL --- ---
    Vitam vas v nove diskusi, uroven nechavam odbornou, drzte se prosim tematu nadhozenych v zahlavi. Pkkud by jste chteli tema diskuse o nejake body rozsirit, napiste to sem nebo si rovnou zadejte o prava k uprave nastenky.
    Kliknutím sem můžete změnit nastavení reklam