Экспериментальный турнир: анализ на 4 полухода. Январь 2008.

Пролог.

В рамках разработки собственного шахматного движка, возникла у меня необходимость проверить эффективность оценочной функции различных движков. Для того что бы их сравнить необходимо было поставить все движки в равные условия по глубине анализируемых позиций - фиксированное количество анализируемых полуходов.
Решено было использовать анализ в 4 полухода, исходя из того что 2 полухода (1 полный ход) - это слишком мало, а слишком большое количество полуходов затягивает партии.
Итак, цель турнира - определение силы оценочных функций движков, но не в коем случае не силы самих движков (ведь в некоторых движках сильной стороной может быть не сложность оценочной функции, а скорость, и следовательно, количество анализируемых позиций). Время в данном турнире полностью игнорировалось, хотя справедливости ради надо было отметить, что некоторые движки в таком режиме на всю партию тратили пару секунд, а другие больше минуты.

Часть 1. Отбор движков.

В отборочный круг попали бесплатные движки, участвовавшие в предыдущих турнирах нашего ресурса. Большинство движков на данный момент имеют более новые версии, но думаю что это существенно не повлияет на расстановку сил.
Первое разочарование: некоторые движки просто не понимают игру с фиксированной глубиной анализа. При запуске в режиме "4 полухода" они играли по каким то своим критериям. В список таких движков попали: GreKo, Obender, WildCat, Zeus.
Второе разочарование: читерство. Да да, именно так я это называю. При установке режима игры "4 полухода" многие движки вроде как ориентировались на данное значение, но при этом некоторые ветки рассчитывали глубже (до 10 полуходов). Как правило это был углублённый рассчёт при взятия, шахах и прочих сложных ситуациях. Так было очень интересно наблюдать как TogaII в одной из партий объявила мат в 5 ходов, и это то при анализе в 4 полухода!
Список движков, которые были уличены в читерстве: Ufim, Strelka, Spike, Scorpio, SmartThink, Naum, Ruffian, Mustang, Fruit, TogaII, FreeChess. Таким образом читерами оказалось большиство движков :(.
В турнир был также взят один коммеческий движок - это коммерческая версия рыбки (версия 2.2). Сделано это было из за культа рыбки который имеет место быть и дабы определеить разницу в силе оценки между платной и бесплатной версиями.

Часть 2. Таинство игры.

Весь турнир был проведён силами одного ПК всего за 6 часов (преимущество суперкороткого контроля). Как и следовало ожидать, партии были слабыми и очень напоминали суперблицы невнимательных третьеразрядников.
И тем не менее, несмотря на короткий контроль, это была игра в шахматы... почти всегда.

Что удивило.
Прежде всего удивило то, что бесплатная версия рыбки при таком контроле обошла своего коммерческого брата! Немного, всего на пол очка при 36-и партиях, но я как то ожидал обратного. Не уж то в поле поздних версиях рыбки оценочная функция была немного лучше? И самое интересное, в очных партиях Rybka v1.0 Beta.x64 и Rybka v2.2n2.x64 сыграли со счётом 1.5 - 0.5, в пользу бесплатной версии!!!

Что и требовалось доказать.
А вот результаты, ради которых и запускался данный турнир.

Baron занял третье место (сразу после рыбок), что делает ему честь, так как при стандартной игре на время в последнем турнире (Июнь 2007) он заняол только 13 место. Напрашивается вывод: оценочная функция является сильной стороны Барона, подтянуть бы ему всё остальное. Поймать движок на читерстве не удалось, из за молчаливости в общении с оболочкой.

Мальчиком для битья выступил движок Counter. Не хочется говорить ничего плохого о движке в целом (в июньском турнире он занял 18-е место и 21-го), но ... оценочная функция движка стремится к нулю, непонятно как он вообще умудряется играть. Многие противники умудрились поставить ему мат уже на 4-м или 5-м ходу (причём как белыми, так и чёрными). Вот самые короткие партии турнира:

[White "Counter 0.2"]
[Black "Baron 1.8.1"]
1. f4 d5 2. g4 Bxg4 3. Na3 e5 4. fxe5 Qh4 {(Qd8-h4) +М1/4 0 Мат} 0-1

[White "Baron 1.8.1"]
[Black "Counter 0.2"]
1. e4 f5 2. exf5 g5 3. Qh5 {(Qd1-h5) +М1/4 0 Мат} 1-0

[White "Counter 0.2"]
[Black "Danasah 3.03"]
1. f4 e5 2. fxe5 d6 3. exd6 Bxd6 4. g4 Qh4 {(d8h4) +М1/4 0 Мат} 0-1

[White "Fruit 2.1"]
[Black "Counter 0.2"]
1. e4 {(e2e4) +0.01/1 0} f5 2. exf5 {(e4xf5 Ng8f6 Nb1c3 Nb8c6) +0.45/4 0}
g5 3. Qh5 {(Qd1h5+) +М1/4 0 Мат} 1-0

[White "Scorpio 1.91"]
[Black "Counter 0.2"]
1. e4 {(e2-e4 Ng8-f6 Nb1-c3 e7-e5) +0.24/4 0} f5 2. exf5 {(e4xf5 Ng8-f6)
+1.32/2 0} g5 3. Qh5 {(Qd1-h5) +М1/4 0 Мат} 1-0

Ужасные показатели игры при таких контролях показали также движки Delfi 5.1 и Danasah 3.03, занявшие, тем не менее, соответственно шестое и четырнадцатое место в июньском турнире.

Заключение.
В заключение могу сказать только то, что турнир в общем то не удался даже в том ключе в котором задумывалось. Несмотря на равные заданные условия (глубина анализа), каждый движок понимал эти параметры посвоему, подключая углублённый анализ в необходимых ему ситуациях. Таким образом движки играли в неравных условиях.

    Движок              Счет    Ry Ry Ba Uf Na Fr To Sm Sp Sc St Ru Bo Mu Fr Da Ve De Co    S-B
01: Rybka v1.0 Beta.x64 32.0/36 ·· 1= 10 01 11 11 =1 11 11 01 11 11 11 11 11 11 11 11 11  515,00
02: Rybka v2.2n2.x64    31.5/36 0= ·· 00 11 11 01 11 11 11 11 11 11 11 11 11 11 11 11 11  490,50
03: Baron 1.8.1         29.5/36 01 11 ·· 00 01 =1 11 10 =1 11 11 11 1= 11 11 11 11 11 11  458,25
04: Ufim 8.02           29.0/36 10 00 11 ·· 11 1= 01 11 1= 11 =0 =1 11 11 11 11 11 11 11  450,00
05: Naum 2.0 (x64)      25.0/36 00 00 10 00 ·· 01 11 11 =0 11 11 0= 11 11 11 11 11 11 11  338,25
06: Fruit 2.1           23.5/36 00 10 =0 0= 10 ·· 00 01 11 11 =0 11 1= 11 =1 11 11 11 11  322,25
07: TogaII 1.2.1        21.5/36 =0 00 00 10 00 11 ·· 00 10 01 11 10 10 11 11 11 11 11 11  273,50
08: SmarThink 0.17a     21.5/36 00 00 01 00 00 10 11 ·· 01 01 01 01 11 1= 11 11 11 11 11  269,50
09: Spike 1.2 turin     20.0/36 00 00 =0 0= =1 00 01 10 ·· 00 11 11 10 =0 11 11 11 11 11  251,75
10: Scorpio 1.91        20.0/36 10 00 00 00 00 00 10 10 11 ·· 11 00 10 11 11 11 11 11 11  238,00
11: Strelka 1.0 beta    19.0/36 00 00 00 =1 00 =1 00 10 00 00 ·· 11 10 11 11 11 11 11 11  222,25
12: Ruffian 1.05        18.5/36 00 00 00 =0 1= 00 01 10 00 11 00 ·· =1 1= 1= 11 11 11 11  217,50
13: Booot 4.13          17.0/36 00 00 0= 00 00 0= 01 00 01 01 01 =0 ·· 1= 11 11 11 11 11  178,25
14: Mustang 4.35        12.0/36 00 00 00 00 00 00 00 0= =1 00 00 0= 0= ·· 10 11 11 11 11   92,50
15: FreeChess2 2.17b    10.0/36 00 00 00 00 00 =0 00 00 00 00 00 0= 00 01 ·· 11 11 11 11   57,00
16: Danasah 3.03        4.0/36  00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ·· 01 10 11    8,00
16: VeryChess           4.0/36  00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 10 ·· 10 11    8,00
16: Delfi 5.1           4.0/36  00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 01 01 ·· 11    8,00
19: Counter 0.2         0.0/36  00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ··    0,00

Результаты турнира: Tournamed.2008.01.rar

342 games played / Tournament finished
Название турнира: Move in 4
Место/ Страна: , Ukraine
Уровень: 4 Полуходы
Оборудование: Dual Intel(R) Core(TM)2 CPU 6300 @ 1.86GHz с 2 048 MB памяти
Операционка: Windows (TM) Vista x64 Business Professional Service Pack 1, v.668 (Build 6001)
Website: http://www.verychess.com
адрес e-mail: test@verychess.com

Submitted by Admin on 7 January, 2008 - 16:35.