Sám o machine learning vím prd, ale mám na starost web archiving operation v NK ČR a chystáme se zpracovat naše fondy a zveřejnit datový sety např. ve WANE (
https://webarchive.jira.com/wiki/display/ARS/WANE+Overview+and+Technical+Details). Rád bych tu viděl nějaké zajímavé open nástroje na zpracování dig. objektů. Jak textové, tak obrazové a zvukové. Jelikož jeden téměř se zero budget a bez zázemí lidí, je to defakto myself operation po technický stránce. Takže hledám coliv, co se může nasadit out-box a co by nějak mohlo zaujmout veřejnost.