Od klasyfikacji ręcznie pisanych cyfr po generowanie ciągów tekstowych - zestawy danych, które od dawna skupiają się na społeczności uczących się maszyn, różnią się znacznie pod względem tematycznym.Od pewnego czasu ponownie duże interesowanie budzi budowanie zbiorów danych, które są istotne społecznie i kulturowo, tak aby badania algorytmiczne mogły mieć bardziej bezpośredni i bezpośredni wpływ na społeczeństwo.
Jednym z takich obszarów jest historia i nauki humanistyczne, w których lepsze i odpowiednie modele uczenia maszynowego mogą przyspieszyć badania w różnych dziedzinach. W tym celu zaproponowano nowo wydane testy porównawcze i modele do transkrypcji historycznego japońskiego pisania kursywą, jednak dla całej dziedziny wykorzystującej uczenie maszynowe dla historycznych japońskich dzieł sztuki nadal pozostaje w dużej mierze niezbadane.
Aby wypełnić tę lukę, Japończycy stworzyli nowy zestaw danych KaoKore, który składa się z twarzy pochodzących z historycznej japońskiej grafiki. Jego wartością jest zarówno to, że może służyć za zestaw danych do klasyfikacji obrazów, jak zasób danych kreatywnych i artystycznych, które badamy za pomocą modeli generatywnych.
AI ucząc się portretów może później wykorzystać je w tworzeniu modeli socjologicznych. Jednocześnie maszyny uczą się tworzenia stylizacji portretów w określonym historycznym kontekście.