• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    TOMMastodon 🐘 / Fediverse - decentralizovaná sociální síť
    XCHAOS
    XCHAOS --- ---
    ALMAD: takhle, peníze neodmítám, ale jsem keynesiánec, ne monetarista. Pro keynesiánce jsou peníze užitečný popis té reality barteru. Samy v podstatě neexistují. Ilustrativní bonmot: pro Keynese tvrdit, že stát nemůže stavět silnice kvůli nedostateku peněz bylo to samé, že nemůže postavit peníze kvůli nedostatku kilometrů. Reálnou ekonomik viděl jinde. Pro monentaristy jsou peníze prostě jedna z mnoha komodit... a naopak, jakoukoliv komoditu můžeš použít jako peníze, pokud má tato vhodné vlastnosti a peníze nejsou z jakéhokoliv důvodu k dispozici.

    Aby ten decentralizovaný search engine mohl vstoupt na trh a třeba prodávat za peníze nějaké SEO (fakticky mu to zabránit nelze), musí tam být nejdřív ta realita barteru - a pak se teprve nějakou část toho, co je barterováno, můžeš snažit finančně ohodnotit a případě tu pak poskytovat jako službu někomu jinému. Mým ideálem není zcela nepeněžní ekonomika (i když když se význam peněz v ekonomice přeceňuje, je to první krok k tomu, aby ta ekonomika zkolabovala nebo tvořila nějaké bubliny...). Spíš volný trh, na kterém spousta subjektů současně trochu spolupracuje i trochu si konkuruje (ale konkuruje ve smyslu zastupitelnosti - že produkt úplně nezmizí z trhu, pokud jeden z těch subjektů z nějakého důvodu přestane fungovat). Původní myšlenka Internetu je podobná myšlence volného trhu. Vyhledávání nikdy nebylo dořešené, skončilo to u DNS systému, v původním SEO hrálo velkou roli, jestli je obsah na doméně související s obsahem vyhledávání a těžili z toho doménoví spekulanti.

    Na decentralizovaném trhu by určitě existovali nějací SEO spekulanti. Vlastně je to blízké konceptu ochranných známek, ale třeba i různých veletrhů, apod. Důležité je prokázat, že nejsi úplný spammer a podvodník, ale že ten, kdo něco hledá, najde to co hledá. Korporát válčí s Wikipedií, protože samozřejmě odklonila výsledky vyhledání od těch monetizovatelných k neutrálním, encyklopedicky nudným faktům.

    Decentralizované AI je v principu od decentralizovaného vyhledávání neodlišitelné. Vyhledávání je prostě nejprimitivnější forma AI. Nemusíš si představovat jen generativní AI...
    ALMAD
    ALMAD --- ---
    XCHAOS: Ale vlastně by bylo hezký kdyby ten feed zkusila syntetizovat taky marginalia, zkusim mu to navrhnout
    ALMAD
    ALMAD --- ---
    XCHAOS: Jo, myslel jsem ten syntetizovanej small web feed co je zadarmo, ne gati jako takový.

    Víceméně mi vychází, že to směřuje k nějakému barteru "počet queries výměnou za výpčetní výkon a bandwidth dodanou na indexování" — když nad tim tak přemejšlim, v podstatě to znamená odmítnutí peněz jako koncpetu a mediátoru hodnoty a návrat k výměnnému obchodu, kdy se transakce smí účastnit jenom specialisti co jsou toho schopni. Proč ne, ale dost lidí to vylučuje no.

    Podle mě decentralizované vyhledávání je dílčí podproblém problému, který se jmenuje decentralizované AI a to je dílčí podproblém Turingova stroje.

    Jako, nemá náhodou decentralizované AI a decentralizované vyhledávání troooošicku jiné nároky na bandwidth mezi nody, asi tak o několik řádů?
    XCHAOS
    XCHAOS --- ---
    Pro zajímavost: jak teď vypadá a jak dlouho trvá každodenní úklid databáze. Velikost dumpu se teď drží na 20 GB (pro ty, kdo mi budu radit větší disk: ne, databáze fakt není běžný soubor na disku a 20 GB dump je už docela velká databáze :-) z tohohle je vidět, jak dlouho nad ní trvají ty úklidové operace...). Velikost dumpu teď roste jen o místní obsah a obsah, se kterým uživatelé interagují, což je vlastně zanedbatelné. Pokud by to byl problém, začnu zkracovat tu lhůtu 400 dnů na obsah, se kterým nikdo neinteragoval.

    Pokud zvažujete provoz vlastní instance, ale váháte, jak je to složité... tak tohle byl trochu hlavolam objevit, ty commandline parametry nejsou online zdokumentované, ale samotné pouštění je už jednoduché. Hack na zvýšení velikosti statusu a počtu možností v anketě se vygooglit dal, ale verze od verze se musí dělat lehce jinak. Upgrade Mastodonu nedělám, dělá ho kolega odborník na adminování a Ruby on Rails stack, a netriviální na něm je, že vývojáři tiše předpokládají, že máte neustále plně vyupgradovaný právě ten Postgres a Ruby. Ano, provoz instance, u které byste se mohli zaměřit na moderaci a stanovení pravidel, a nemuseli si to celé studovat -to je tak trochu můj "obchodní model". Nejde mi o to, aby mi někdo platil za to, že si u mě založí účet, ale spíš čekám, že si někdo objedná vlastní instanci pro svoji partu lidí.

    f.cz toho času má 750 GB disk ze kterho medální cache a běžící databáze trvale zabírá asi 500 GB. Měsičně aktivních uživatelů je poslední dobou často přes 60, ale podle mě zvýšení počtu uživatelů by nehrálo extra velkou roli, já prostě jen nafollowoval hodně obsahu z jiných instancí, aby u nás něco bylo. Podstatný detail je, že žádná instance si dříve nebo později nebude moc dovolit cacheování obsahu bez interakcí neomezeně hluboko do historie.

    mastodon@f:~/live/bin$ RAILS_ENV=production ./tootctl statuses remove --clean_followed --days=400
    I, [2025-07-28T22:22:29.200984 #45492]  INFO -- : [dotenv] Loaded .env.production
    Extract the deletion target from statuses... This might take a while...
    Removing temporary database indices to restore write performance...
    Beginning statuses removal... This might take a while...
    1/1 |===============================================================================================================================================================================================| Time: 00:01:19
    Done after 281.26838302612305s, removed 764 out of 764 statuses.
    Running "ANALYZE statuses"...
    Beginning removal of now-orphaned media attachments to free up disk space...
    0/0 |===============================================================================================================================================================================================| Time: 00:00:00
    Done after 9.849668502807617s, removed 0 out of 0 media_attachments.
    Creating temporary database indices...
    Extract the deletion target from conversations... This might take a while...
    Removing temporary database indices to restore write performance...
    Beginning orphans removal... This might take a while...
    29/29 |=============================================================================================================================================================================================| Time: 00:00:49
    Done after 233.10693311691284s, removed 28253 out of 28253 conversations.
    Removing temporary database indices to restore write performance...
    Running "ANALYZE conversations"...
    mastodon@f:~/live/bin$ RAILS_ENV=production ./tootctl statuses remove
    I, [2025-07-28T23:46:31.962363 #141040]  INFO -- : [dotenv] Loaded .env.production
    Extract the deletion target from statuses... This might take a while...
    Removing temporary database indices to restore write performance...
    Beginning statuses removal... This might take a while...
    49/49 |=============================================================================================================================================================================================| Time: 00:11:43
    Done after 841.4485964775085s, removed 48290 out of 48958 statuses.
    Running "ANALYZE statuses"...
    Beginning removal of now-orphaned media attachments to free up disk space...
    14014/14014 |=======================================================================================================================================================================================| Time: 00:30:16
    Done after 1816.7492065429688s, removed 14014 out of 14014 media_attachments.
    Creating temporary database indices...
    Extract the deletion target from conversations... This might take a while...
    Removing temporary database indices to restore write performance...
    Beginning orphans removal... This might take a while...
    39/39 |=============================================================================================================================================================================================| Time: 00:01:17
    Done after 207.20253467559814s, removed 38469 out of 38469 conversations.
    Removing temporary database indices to restore write performance...
    Running "ANALYZE conversations"...
    
    XCHAOS
    XCHAOS --- ---
    ALMAD: tak ano, ActivityPub je konvergencí různých nápadů na agregovatelnost a integrovatelnost RSS/Atom feedů. Za mě ten hlavní nápad ActivityPub je digitální podepisování obsahu vázané na doménu. Asociace privátních klíčů s provozem domény je zase úzce spojená s boomem nových exotických TLD.

    Ta kagi.com věc ale vypadá jako nějaký placený vyhledávač. Myšlenka, že když chci search engine bez reklam, musím za to platit jako za novinové články bez reklam, mě popravdě úplně jako Fedi nepřijde. Fedi prostě říká, že když chci sociální síť bez reklam, musím provozovat nějaký její node a pomoci ten obsah šířit dál. Decentralizovaný vyhledávač řeším už léta, dokonce tady na to na NYXu byl klub, který umřel: [Distribuované vyhledávací systémy - YaCy, FAROO a další. Pojďme postavit otevřenou a necenzurovanou variantu Googlu.]

    Obecně by bylo zajímavé srovnat výsledky Kagi.com s
    Home - YaCy
    https://yacy.net/

    Podle mě decentralizované vyhledávání je dílčí podproblém problému, který se jmenuje decentralizované AI. Víceméně mi vychází, že to směřuje k nějakému barteru "počet queries výměnou za výpčetní výkon a bandwidth dodanou na indexování" - nody by se směly ptát proporcionálně k tomu, co dodají, a samozřejmě by bylo nutné nějak prokazovat, že obsah, který dodávají, je současně odpovědí na otázky, které jsou kladeny, atd. Vyhledávání je trochu složitější, než sociální síť, i když princip je do jisté míry podobný...
    ALMAD
    ALMAD --- ---
    Neni to přímo fedi, ale přijde mi to relevantní vibem: dneska na mě vykouklo, že kagi ma RSS věci co indexuje z "malého webu", kde se snažej indexovat hlavně "osobní" stránky.

    Kagi Small Web
    https://kagi.com/api/v1/smallweb/feed/
    HOWKING
    HOWKING --- ---
    KIE: Matodon je "Twitter". Diskuze na něm je dost neohrabaná a nepřehledná. Nyx je náhrada spíš Facebooku, ale ani to ne. (Náhradou Facebooku bylo spíš Mageo, to staré. Veřejné auditko si mohl založit kdo chtěl a v jakémkoliv množství a hlavně okamžitě. Takže se dal založit přechodný Topic, v němž se diskutovalo nad aktualitou. To tady nejde. Založení veřejného auditu je zdlouhavý proces.)
    XCHAOS
    XCHAOS --- ---
    KIE: heh, zajímavá otázka. Třeba na NYXu je dost omezující, že jsou tu jen Češi. Na Mastodonu interaguji lidi z celého světa... je tam automatický překlad, pokud je jazyk statusu správně označen, což už lidi začínají chápat, že je dobré...

    Účet na NYXu nezruším, ale prostě sem budu chodit méně často. Nebo psát méně často. Což už do značné míry pozoruju i u ostatních...
    KIE
    KIE --- ---
    XCHAOS: naprosto narovinu : Mastodonu začnu věřit v momentě, kdy smažeš účet na Nyxu - jinak mám pořád dojem, že je to jen ta "B" síť.
    XCHAOS
    XCHAOS --- ---
    Chao-c': "Idea for #mastodon compatible web app, maybe comp…" - f.cz - fskutečnosti Fedivesmír :-) Brána do federace sociálních sítí. 2000 znaků pro vaše příspěvky.
    https://f.cz/@xChaos/114920257022963599
    XCHAOS
    XCHAOS --- ---
    Tak už zase nemáme nejnovější verzi, ale zato nám rostou MAU - montly active users :-) Celkově doména .cz ale bída...
    |                        Domain |             Version | Monthly | Max.char | Max.poll | Translate | New user | Approve |   Image |   Video |
    |              mastodonczech.cz |               4.3.5 |     601 |      500 |        4 |      True |     True |   False |   16 MB |   99 MB |
    |                     witter.cz |               4.3.5 |     231 |      500 |        4 |     False |     True |   False |   16 MB |   99 MB |
    |                   pixelfed.cz |               3.5.3 |     177 |      500 |        0 |     False |     True |   False |   34 MB |   34 MB |
    |        mastodon.arch-linux.cz |               4.4.2 |     110 |     2000 |        4 |      True |    False |   False |   16 MB |   99 MB |
    |                          f.cz |               4.4.1 |      66 |     2000 |       10 |      True |     True |   False |   16 MB |   99 MB |
    |                  cztwitter.cz |               4.0.6 |      63 |      500 |        4 |     False |     True |   False |   10 MB |   40 MB |
    |                   mamutovo.cz |               4.4.2 |      38 |     2000 |        4 |      True |     True |   False |   16 MB |   99 MB |
    |            mastodon.pirati.cz |               4.3.7 |      27 |      500 |        4 |     False |     True |    True |   16 MB |   99 MB |
    |        mastodon.urbancloud.cz |               4.4.2 |      11 |      500 |        4 |     False |    False |   False |   16 MB |   99 MB |
    |                    kompost.cz |               4.4.2 |      10 |      500 |        4 |     False |    False |   False |   16 MB |   99 MB |
    |              toot.whatever.cz |               4.4.2 |       5 |      500 |        4 |     False |     True |   False |   16 MB |   99 MB |
    |               social.meyer.cz |               4.4.1 |       4 |      500 |        4 |     False |     True |    True |   16 MB |   99 MB |
    |                     spondr.cz |               4.4.2 |       3 |      500 |        4 |      True |    False |   False |   16 MB |   99 MB |
    |           mastodon.macsnet.cz |               4.4.1 |       3 |     5000 |      400 |     False |    False |   False |   16 MB |   99 MB |
    |                    skorpil.cz |        4.4.1+glitch |       3 |     3000 |        5 |     False |    False |   False |   16 MB |   99 MB |
    |                    rozhlas.cz |               4.4.1 |       2 |      500 |        4 |     False |    False |   False |   16 MB |   99 MB |
    |              mastodon.1984.cz |               4.3.7 |       2 |      500 |        4 |     False |     True |    True |   16 MB |   99 MB |
    |               rodina-sucha.cz |               4.4.2 |       1 |      500 |        4 |     False |    False |   False |   16 MB |   99 MB |
    |            mastodon.morwud.cz |               4.4.1 |       1 |      500 |        4 |     False |    False |   False |   16 MB |   99 MB |
    |                   taborsky.cz |               4.4.1 |       1 |      500 |        4 |     False |    False |   False |   16 MB |   99 MB |
    |                    jirutka.cz |              4.2.13 |       1 |     2500 |        4 |     False |    False |   False |   16 MB |  256 MB |
    |               mastodon.cxm.cz |               4.3.2 |       1 |      500 |        4 |     False |    False |   False |   16 MB |   99 MB |
    |               toot.dvratil.cz |               4.3.8 |       1 |      500 |        4 |     False |    False |   False |   16 MB |   99 MB |
    |                     mutant.cz |               4.4.1 |       1 |      500 |        4 |     False |     True |    True |   16 MB |   99 MB |
    |       mastodon.zs-studanka.cz |               4.4.1 |       1 |      500 |        4 |     False |    False |   False |   16 MB |   99 MB |
    |              social.toxwat.cz |              4.1.22 |       1 |      500 |        4 |     False |     True |    True |   10 MB |   40 MB |
    |                   macadmin.cz |               4.3.9 |       1 |      500 |        4 |     False |    False |   False |   16 MB |   99 MB |
    |           mastodon.starnet.cz |               4.3.4 |       1 |      500 |        4 |     False |     True |    True |   16 MB |   99 MB |
    |                      bobek.cz |               4.4.2 |       1 |      500 |        4 |     False |    False |   False |   16 MB |   99 MB |
    |                    torsten.cz |               4.3.4 |       1 |      500 |        4 |     False |     True |    True |   16 MB |   99 MB |
    |            blovice.bahnhof.cz |               2.7.2 |       1 |    65536 |       20 |     False |    False |    True |   64 MB |   64 MB |
    |              social.sukany.cz |               4.3.8 |       1 |      500 |        4 |     False |    False |   False |   16 MB |   99 MB |
    |            mastodon.hinata.cz |               4.1.4 |       1 |      500 |        4 |     False |     True |    True |   10 MB |   40 MB |
    |             mastodon.train.cz |              4.2.10 |       1 |      500 |        4 |     False |    False |   False |   16 MB |   99 MB |
    |                       blep.cz |        4.3.7+glitch |       1 |      500 |        5 |     False |    False |   False |   16 MB |   99 MB |
    |              mastodon.haxo.cz |               4.1.0 |       1 |      500 |        4 |     False |     True |   False |   10 MB |   40 MB |
    |                         Total |                  38 |    1378 |
    |                   Nonmastodon |                  15 | unknown |
    
    XCHAOS
    XCHAOS --- ---
    HOWKING: ráno jsem nad tím kroutil hlavou a pustil jsem ještě obyčejně tootctl statuses remove (bez followovaných, 90 dnů) a ejhle:
    Done after 156.57609629631042s, removed 64093 out of 64093 conversations.
    tolik toho tam za pár dnů od předchozího puštění naskákat nemohlo!

    Takže je to nejspíš strašně ubastlené. Zřejmě v reakci na smazání statusy uživatelů, které někdo followuje ale nikdo s nimi neinteragoval, se vynořily nové statusy, které nikdo nefollowuje, ale které byly reakcí na něco, co už je smazané, a zřejmě by se to mělo pouštět pořád dokola - 100 000 statusů navíc jsem přeci jen smazal, a to není málo, i když záloha se smrskla stěží tak o giga.

    Podle mě velkou část databáze představují ty další relace - v podstatě favy, boosty, apod. - které se pochopitelně při mazání statusů, které ty lokální interakce nemají, nemažou a v databázi zůstávají. Uvidíme, jak se to vyvine dál. Kdybych si nestanovil limit 400 dnů, ale třeba něco přes půl roku - 200 dnů - tak se dost možná smazalo ještě víc, než 100 000 statusů celkem.

    Asi hlavní problém je, že to chování je v online dokumentaci popsané značně neúplně, takže kdo hledal řešení v dokumentaci, asi docela narazil...
    HOWKING
    HOWKING --- ---
    XCHAOS: :D (asi důvod, proč není veřejně známá :D - astrodon nezachráněn :D)
    XCHAOS
    XCHAOS --- ---
    Aha, tak se nesmazalo v podstatě nic. Hmm.
    XCHAOS
    XCHAOS --- ---
    Done after 175.2759621143341s, removed 44901 out of 44901 conversations.

    Tak to bylo nějaký rychlý. To jsem teda zvědav na velikost zálohy databáze zítra :-)
    XCHAOS
    XCHAOS --- ---
    HOWKING: no ale podle mě ten admin neznal tuhle feature, protože v online dokumentaci chybí... dá se teda získat ze zabudované dokumentace:

    mastodon@f:~/live/bin$ RAILS_ENV=production ./tootctl statuses help remove
    I, [2025-07-13T20:07:24.259488 #3779230]  INFO -- : [dotenv] Loaded .env.production
    Usage:
      tootctl statuses remove
    
    Options:
          [--days=N]                                                                   
                                                                                       # Default: 90
      -b, [--batch-size=N]                                                             # Number of records in each batch
                                                                                       # Default: 1000
          [--continue], [--no-continue], [--skip-continue]                             # If remove is not completed, execute from the previous continuation
                                                                                       # Default: false
          [--clean-followed], [--no-clean-followed], [--skip-clean-followed]           # Include the status of remote accounts that are followed by local accounts as candidates for remove
                                                                                       # Default: false
          [--skip-status-remove]                                                       # Skip status remove (run only cleanup tasks)
                                                                                       # Default: false
          [--skip-media-remove]                                                        # Skip remove orphaned media attachments
                                                                                       # Default: false
          [--compress-database], [--no-compress-database], [--skip-compress-database]  # Compress database and update the statistics. This option locks the table for a long time, so run it offline
                                                                                       # Default: false
    
    Description:
      Remove statuses that are not referenced by local user activity, such as ones that came from relays, or belonging to users that were once followed by someone locally but no longer are.
    
      It also removes orphaned records and performs additional cleanup tasks such as updating statistics and recovering disk space.
    
      This is a computationally heavy procedure that creates extra database indices before commencing, and removes them afterward.
    
    HOWKING
    HOWKING --- ---
    XCHAOS: Ten už je mrtvý. Nedá se použít ani k posílání pošty. Je to jen statická zakonzervovaná stránka.
    XCHAOS
    XCHAOS --- ---
    HOWKING: asi jsem objevil řešení pro astrodon, to je telepatie. Vyřiď adminovi, že existuje nedokumentovaná feature:

    tootctl statuses remove --clean_followed

    Myšlenka je smazat cacheované statusy bez místních interakcí (žádný boost ani fav ani bookmark, ani ten teda pin na profilu). Standardní chování ovšem je, že statusy odjinud, které jsou v cache, ale někdo je followuje, stejně smazány nebudou - to jsou ale skoro všechny, jinak by až na pár odpovědí nebyly v cache, že... Ale ten parametr -clean_followed to přebije a smaže i staré followované statusy, které ale nikoho místního nezaujaly. Jde stanovit i stáří, default je 90 dnů (to dokumentované je, parametr --days).

    On to v podstatě takový torrent je, dá se říct. Samozřejmě, že si můžeš na svoji instanci statusy odjinud vždy načíst a třeba favnout nebo boostnout, když znáš jejich URL (např. přes "otevřít původní stránku"). Ale statusů, které jsou nacacheované, ale nikdo místní s nimi neinteragoval, je strašně moc a bude jich v budoucnu čím dál víc. Zkrátka
    XCHAOS
    XCHAOS --- ---
    Chao-c': "Objevil jsem, že požadované vymazání starých cach…" - f.cz - fskutečnosti Fedivesmír :-) Brána do federace sociálních sítí. 2000 znaků pro vaše příspěvky.
    https://f.cz/@xChaos/114847108307062487
    Kliknutím sem můžete změnit nastavení reklam