• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    PANTARILDistribuované vyhledávací systémy - YaCy, FAROO a další. Pojďme postavit otevřenou a necenzurovanou variantu Googlu.
    XCHAOS
    XCHAOS --- ---
    POSTCD: já to naposledy pustil před pár lety.

    Ano, máš přístup k miliardám indexovaných stránek v rámci Distributed Hash Table, ale problém je neexistujícó hodnocení relevance výsledků. Takže na běžná klíčová slova dostaneš sice nějaké výsledky, ale ve srovnání s tím, co lidi očekávají od Googlu, bohužel naprosto obskurní.

    Ale před těmi 2-3 lety byla použitelnost řádově vyšší, než když jsem to pouštěl poprvé třeba před 10 lety.
    POSTCD
    POSTCD --- ---
    Ahoj, jak je to s Yacy dnes v porovnání s běžnými vyhledávači? (vaše subjektivní porovnání)
    Vypadá to, že každý peer může přidat webové adresy, které chce stáhnout/indexovat a po propojení s ostatními peery může využívat společný index. Jen nechápu jak/jestli může Yacy poskytovat komplexní vyhledávání v miliardách stránek, pokud se připojím jen k omezenému množství peerů (tito peeři musí mít jen relativně málo indexovaných stránek).
    Napíšete prosím, kolik máte indexovaných stránek, využití paměti a disku programem Yacy pro představu náročnosti tohoto software?
    XCHAOS
    XCHAOS --- ---
    VITEX: no vzdal jsem to, nicměně Fediverse by byl dobrý zdroj linků k oindexování...
    VITEX
    VITEX --- ---
    XCHAOS: Už ?

    XCHAOS
    XCHAOS --- ---
    tak jsem to po letech nainstaloval a vypadá to o poznání schopněji, akorát mi to asi brzy zaplní disk na serveru :-
    YaCy '#[clientname]#': Search Page
    http://77.87.241.166:8090/
    YaCy '#[clientname]#': Index Browser
    http://77.87.241.166:8090/HostBrowser.html?hosts=
    NEKROMANT
    NEKROMANT --- ---
    Nelíbí se mi, kam se internet vydal, říká vynálezce WWW. Chce to změnit - iDNES.cz
    https://www.idnes.cz/...t/internet/tim-berners-lee-internet-web-solid.A181016_132706_sw_internet_pka
    VITEX
    VITEX --- ---
    XCHAOS: Uživatelé vlastně plní roli levné náhrady macatého AI ...
    XCHAOS
    XCHAOS --- ---
    KEDRIGERN: on ten Yacy nacházel hrozné koniny. a zřejmě je hlavně obrovský problém s řazením výsledků. buď je to v podstatě náhodný výběr, a nebo hrozí zneužití algoritmu spammery (a nebo oboje). bez nějaké zpětné vazby hledajících uživatelů to v podstatě provozovat nejde.
    PANTARIL
    PANTARIL --- ---
    DRUDRIGER2: podle wiki majitel sluzbu v unoru 2012 ukoncil s tim ze je blokovala antispamova ochrana googlu a meli problemy s DDoS utoky.

    Tady pisou o nekterych alternativach: http://duckduckgo.com/ https://ixquick.com/ https://www.startpage.com/ atd.
    DRUDRIGER2
    DRUDRIGER2 --- ---
    nevite nekdo nejak proc nejde scroogle nejak sem po tom patral ale s moji anglitsinou sem tomu moc neporozumnel
    KEDRIGERN
    KEDRIGERN --- ---
    XCHAOS: Byl by to dobrý vtip, kdyby FB obětoval nepatrně svého výkonu a udělal pár velkých YaCy nodes :-D :-).
    XCHAOS
    XCHAOS --- ---
    Facebook zuří, Google ho totiž ignoruje - Živě.cz
    http://www.zive.cz/bleskovky/facebook-zuri-google-ho-totiz-ignoruje/sc-4-a-162057/default.aspx

    já to říkám pořád - potřebujeme decenrtalizované, distribuované vyhledávání.

    ale yacy se mi pořád průměrně 1x denně kouše. takže ho prostě jako primární search zatím nepoužívám :-/
    XCHAOS
    XCHAOS --- ---
    Yacy se docela rozjelo. Třeba dnes vidím 483 nodů, které indexují 2.7 miliardy stránek. To je proti těm začátkům docela dost... nedávno se to skokově zlepšilo z cca miliardy na dvě, a od té doby počet indexovaných stránek vytrvale roste.
    PANTARIL
    PANTARIL --- ---
    NEKROMANT: hm uz jsem to dlouho nerestartoval a kdyz jsem to ted zkusil, tak to uz ani nenabehlo s chybou malo pameti. Budu to muset nekdy aktualizovat a znovu rozhcodit ale ted na to nemam prostor.
    NEKROMANT
    NEKROMANT --- ---
    Tak nevím jak vám, ale mě https://yacy.kalevala.cz/ stále nejede (asi to nebude množstvím uživatelů..)
    XCHAOS
    XCHAOS --- ---
    NEKROMANT: nj, je to celý hrozný javový bastl... budu na to muset vyhradit dedikovaný server s víc RAM :-(

    už teď vymýšlím, jak to naprogramovat líp...
    KEDRIGERN
    KEDRIGERN --- ---
    NEKROMANT: Ale tak to je současný stav. Teď je verze 1, to by mohlo vzbudit pozornost. A postupně narůst počet uzlů. Pak top bude ok.

    Stejně jako torrenty. Úplně na nic pro dva lidi, ale pro 1000?

    Například Pirátské strany uvažují o zprovoznění uzlů. Kdyby to bylo na slušném železe, tak by to hnedle mohlo být něco jiného. A určitě je takových organizací vícero :).
    NEKROMANT
    NEKROMANT --- ---
    https://yacy.kalevala.cz/ píše 500 - Internal Server Error
    Existují nějaké další české peery? :)
    NEKROMANT
    NEKROMANT --- ---
    Tímhle http://teckacz.arachne.cz:8080/Network.html se dá kochat.. terminál vypadá vizuálně ještě zajímavější, ale chce to heslo a zatěžuje to dost procesor :)
    NEKROMANT
    NEKROMANT --- ---
    Horší je, že i když to nějaké výsledky vyhodí (často to ani to ne) tak jsou buď žalostné a nebo to napíše že to nenašlo nic :)
    Přitom jiné vyhledávače (seznam, ddg.gg, scroogle.org ...) nabídnou lepší výsledky..
    Ale také tam jsou rozdíly..
    Prostě v praxi je pro mě yacy dobrý jen na hraní.. :)
    Myšlenka dobrá, ale proti komerční proprietální a centralizované konkurenci to zatím neobstojí.. :)
    Kliknutím sem můžete změnit nastavení reklam