nekocave.xyz

# # #
Кластеры фажества художников по персонажам

Была взята база #, исключены картинки с official_art и game_cg. Затем исключены картинки с 3+ персонажами. Далее составлялись пересечения между персонажами и художниками. Брались художники, у которых после фильтров осталось 10+ картинок. Таких получилось ~55921 "человек". Теперь для художника составлялся вектор из трёх чисел: его самые часто-используемые персонажи по % использования. Затем художники объединялись в кластеры.

Кластеры выглядят так:
21194 0.092, 0.067, 0.058 37.9%
10898 0.167, 0.116, 0.084 19.5%
5279 0.229, 0.186, 0.104 9.4%
4578 0.271, 0.095, 0.073 8.2%
2205 0.373, 0.180, 0.087 3.9%
1585 0.493, 0.110, 0.075 2.8%
1238 0.290, 0.214, 0.170 2.2%
1194 0.406, 0.345, 0.072 2.1%
993 0.395, 0.085, 0.069 1.8%
989 0.171, 0.170, 0.169 1.8%
906 0.311, 0.275, 0.089 1.6%
856 0.486, 0.457, 0.029 1.5%
545 0.590, 0.170, 0.082 1.0%
540 0.729, 0.089, 0.057 1.0%
429 0.617, 0.079, 0.066 0.8%
424 0.363, 0.291, 0.175 0.8%
341 0.482, 0.257, 0.081 0.6%
311 0.413, 0.202, 0.176 0.6%
292 0.523, 0.364, 0.072 0.5%
213 0.582, 0.286, 0.065 0.4%

Как читать:
[кол-во художников] [% для самого популярного персонажа, % для второго самого популярного, % для третьего] [% кол-ва художников от генеральной совокупности]

Не знаю как правильно визуализировать эту таблицу, извините.

Таким образом:
38% художников имеют не более 9.2% артов по самому любимому персонажу. Это так называемые "нормальные люди".
У 19.5% самый популярный персонаж присутствует на 16.7%. Эти тоже норм.
Вырожденцы начинаются с четвёртой строки: целых 27% постов — одному персу.
А ведь ещё ниже есть 1.8%, которые посвятили 62%+ одному персу. То есть на 2 работах из 3 у них один и тот же персонаж.


Это первая часть поста. Через час будет вторая, там и исходники будут.