• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    PANTARILDistribuované vyhledávací systémy - YaCy, FAROO a další. Pojďme postavit otevřenou a necenzurovanou variantu Googlu.
    Klub je určen k diskusi o všem, co může souviset s problematikou distribuovaných vyhledávacích systémů:

    - proč vůbec používat distribuované vyhledávání? Jaké jsou jeho výhody a nevýhody oproti stávajícím řešením?
    - mají distribuované vyhledávače šanci prosadit se v konkurenci google, bing, baidu apod?
    - jak přistupovat k jejich propagaci, jak zajistit, aby byly dostatečně rozšířené a tím pádem použitelné?
    - když chci provozovat uzel, jaký software vybrat?
    - instalace, konfigurace zvoleného softwaru

    Uzly uživatelů nyxu:
    http://teckacz.arachne.cz:8080/ (YaCy)
    https://yacy.kalevala.cz/ (YaCy)

    Distribuovane vyhledavaci systemy:
    YaCy: http://yacy.net/ (Windows, Linux, Mac OSX) Forum | irc: #yacy@chat.freenode.net
    FAROO: http://www.faroo.com/hp/p2p/p2p.html (Windows only)

    Mailing list o p2p systemech

    Spriznene kluby:
    [ Diaspora, GNU social a jine facebooky treti generace ]
    rozbalit záhlaví
    XCHAOS
    XCHAOS --- ---
    NEKROMANT: nj, je to celý hrozný javový bastl... budu na to muset vyhradit dedikovaný server s víc RAM :-(

    už teď vymýšlím, jak to naprogramovat líp...
    NEKROMANT
    NEKROMANT --- ---
    Tímhle http://teckacz.arachne.cz:8080/Network.html se dá kochat.. terminál vypadá vizuálně ještě zajímavější, ale chce to heslo a zatěžuje to dost procesor :)
    NEKROMANT
    NEKROMANT --- ---
    Horší je, že i když to nějaké výsledky vyhodí (často to ani to ne) tak jsou buď žalostné a nebo to napíše že to nenašlo nic :)
    Přitom jiné vyhledávače (seznam, ddg.gg, scroogle.org ...) nabídnou lepší výsledky..
    Ale také tam jsou rozdíly..
    Prostě v praxi je pro mě yacy dobrý jen na hraní.. :)
    Myšlenka dobrá, ale proti komerční proprietální a centralizované konkurenci to zatím neobstojí.. :)
    XCHAOS
    XCHAOS --- ---
    ...a to už delší čas a dělá to i verze 1.0

    (málo paměti?)
    XCHAOS
    XCHAOS --- ---
    právě jsem zjistil, že mi to vždy zvládne jen jeden dotaz... každý druhý dotaz vrací

    UNRESOLVED_PATTERN- ; (-UNRESOLVED_PATTERN- local, -UNRESOLVED_PATTERN- remote), -UNRESOLVED_PATTERN- from -UNRESOLVED_PATTERN-
    XCHAOS
    XCHAOS --- ---
    hustý, dnes vidím 1222 peerů
    XCHAOS
    XCHAOS --- ---
    Googlu roste další konkurence, svobodný vyhledávač YaCy | Computerworld.cz
    http://computerworld.cz/internet-a-komunikace/googlu-roste-dalsi-konkurence-svobodny-vyhledavac-yacy-44197
    KEDRIGERN
    KEDRIGERN --- ---
    XCHAOS
    XCHAOS --- ---
    NEKROMANT: hmm. všechny výsledky v němčině :-( to na mém nodu není
    NEKROMANT
    NEKROMANT --- ---
    Load Balancer for YaCy Peers
    YaCy - The Peer to Peer Search Engine: Search Portal
    http://yacy.net/en/Searchportal.html
    XCHAOS
    XCHAOS --- ---
    YaCy 'teckacz': Search Page
    http://teckacz.arachne.cz:8080/
    dnes po upgradu a restartu jede, vidím 1.4 miliardy stránek a dále indexuju
    XCHAOS
    XCHAOS --- ---
    tak http://teckacz.arachne.cz:8080 mi už poslední dobou nepadá tak často.
    dnes vidím 1.3 miliardy stránek.
    NEKROMANT
    NEKROMANT --- ---
    Zajímavé je že dlouhou dobu to umí také seznam, na rozdíl od googlu, který to neumí, stejěn tak neumí podcasty/vcasty z youtube :)
    XCHAOS
    XCHAOS --- ---
    VITEX: max. počet stránek indexovaných za minutu se dá hodně omezit, případně vůbec sám necrawlovat a pouze přijímat Distributed Hash Transfery.

    jinak spolupráci na vývoji klienta napsaného v C je právě to, k čemu bych schopnější lidi v tomhle klubu třeba časem rád vyhecoval :-) minimálně bude potřeba zjistit, jaké existují hotové knihovny a kde se dá nastudovat jejich API... víceméně, na C je tu teda i jiný klub, ale tam s tebou nejdřív všichni budou polemizovat, že to vlastně vůbec není potřeba psát: [ ANSI C/C99 (specifikace), GNU C (gcc, glibc), Tiny C (tcc) a POSIX - ne nutně C++,g++,libstdc++ nebo Win32 API ] - prostě ten klub není úplně zralý.

    kdyby tady proběhla diskuze,co přesně nás štve na Yacy, a jak to vlastně asi celé funguje - tak by pak mělo smysl v klubu o ANSI C začít debatovat, jak by se to dalo zoptimalizovat implementací v C...
    VITEX
    VITEX --- ---
    Stále čekám na klienta napsaného v C. Jelikož používám na serveru openfire, obávám se že nemám dostatečný výkon na provoz druhé javové zběsilosti...
    XCHAOS
    XCHAOS --- ---
    Poslední dobou se Yacy stabilně drží na cca 1.3 miliardy stránek - zřejmě někdo spustil nějaký velký výkonný node. počet nodů pořád hodně osciluje, cca mezi 90-120.

    nadále mi to padá asi tak obden.
    XCHAOS
    XCHAOS --- ---
    Yacy: dnes > 130 dosažitelných nodů a > 1.3 miliardy indexovaných stránek. to je docela rekord...
    XCHAOS
    XCHAOS --- ---
    PANTARIL: takhle ... 100-150 nodů je to, s kolika navážeš přímé spojení... ale celková velikosti sítě je podle mě větší....

    každopádně souhlasím, že by se do projektu muselo zapojít tak 1000x víc lidí, aby to za něco stálo
    PANTARIL
    PANTARIL --- ---
    XCHAOS: nahodou ty posledni verze uz mi vubec nepadaji, akorat ta relevance vysledku je mizerna, ale to je dano nejspis tim, ze je nutno nacrawlovat miliardy stranek a ulozit petabyty dat aby to za neco stalo, a na to tech 150 domacich nodu nemuze mit nikdy kapacity. Takze je potreba rozsirit uzivatelskou zakladnu:)

    Je dobre ze vyvoj ocividne nestoji, od posledne zas pribyl novy release.
    XCHAOS
    XCHAOS --- ---
    PANTARIL: no, bejt nima, tak radši chodím kanálama :-)
    Kliknutím sem můžete změnit nastavení reklam