April 10, 2023
Pix2Struct
Вообще забавно, сколько годнейшего ресерча проходит мимо всех просто потому что в твиттере никто не запостил толком....
Обучение оригинальной pix2struct было похожим на обучение bart like модели на mlm task, но с рядом отличий
- в качестве претрейна сделали следующее: взял сет Book corpus, средерили(ака перевели в картинки тексты) и обучили на этом модель
- Пачка сетов пар UI render - html
- Screen2words - что на картинке и что оно делает