JARDABEREZA: tak jasně že licence toho z čeho se to naučilo nikdo moc neřešil..
a je to hlavně o objemu, ne o kvalitě. nějaký pokusy učit to na kvalitních datech / učebnicích programování byly, ale nezaznamenal jsem že by byly výrazně lepší než obecný sota LLM..
některý byly teda speciálně na coding. ale spíš tuning než kvalita dat.
ale nevím, sám jsem to teď na programování dlouhou dobu nepoužil..