Fouras писал(а):Даже так: за 4 часа АльфаЗеро сравнялся в силе со СтокФиш, поэтому эта цифра часто упоминается. Чтобы заметно превзойти СтокФиш, гоняли 9 часов. Это уже более 100 лет. Без сна и отдыха.
Хороший такой маркетинговый ход, сделать вид что тренировка сети малозначительный фактор. Неявно приравнивая тренировку сети к тренировке человека, ребята откровенно мухлюют. Впрочем это не отменяет достоинства самого алгоритма обучения, даже не смотря на то, что он даже близко не дотягивает до возможностей ребенка пересоздающего язык на основе сэмплов без априорной информации. Все правила дети формируют сами. Это примерно как если бы компу просто давали на вход видео матча, а он бы из него вывел весь свод правил и исключений, включая технологию изготовления шахмат. Чисто логически не сложно, но как и все NP-задачи очень сильно зависит от доступных ресурсов. Что собственно шахматные программы наглядно и демонстрируют в игре друг с другом. Ну а в игре против человек тут программисты и вовсе уподобились напёрсточникам. Ну да, выиграть выиграли, ну а то что то в рукаве был туз - не важно. Никто же не заметил...