Stockfish 7 wygrał turniej testowy nowych silników szachowych Jurek Chess Engines Rating, 2016.04.09 - 2016.04.10
Games download | Tempo | Hardware | System |
180 games | 3' + 3" | Intel(R) Core(TM) i7-4710MQ CPU @ 2.50GHz z 7,9 GB | Windows 10 64 bit |
DOWNLOAD | |||
Book | GUI | JCER Games | Tabela |
Perfect 2015 | Arena 3.5.1 | 106.606 games download | Scid vs PC |
Okazało się, że "stary" Stockfish 7 jest lepszy od kompilacji kwietniowych!
Ale zwracam uwagę na silnik Soberango. Jeszcze niedawno, w pierwszym swoim teście uzyskał wynik = zero!
A tu jako jedyny wygrał partię ze zwycięzcą a ponadto naskubał wiele punktów z innymi Stockfishami.
Za to przegrał aż trzy razy ze słabiutkim Sayuri!
Niesamowita huśtawka wyników. Zobaczymy jak będą rozwijać się kolejne wersje.
A i nowy klon Raubfish - na miejscu czwartym.
"Okazało się, że "stary" Stockfish 7 jest lepszy od kompilacji kwietniowych!"- i to jest odpowiedź na pytanie dlaczego "tu i ówdzie" jest testowana 7 a nie wersje rozwojowe. Wersje rozwojowe mają krótkie żywoty, zmieniają się co chwila i tak naprawdę nie dają możliwości wiarygodnej oceny ich siły gry jeżeli nie są testowane razem z 7. W tym turnieju widać że planowany "rozwój" tak naprawdę był zepsuciem produktu wyjściowego... (przy założeniu że punktem wyjścia była 7 i to ona miała być "poprawiana i rozwijana")
OdpowiedzUsuńDrogi ekspercie. Niedawno był tutaj prezentowany turniej, gdzie kompilacje z marca zlały jak chłopca Stockfisha 7. Pewnie wiesz, że Stockfish 7 to tak naprawdę wersja rozwojowa, która została przez autorów przemianowana na "stabilną". To dobrze że ktoś dla nas testuje te nowe kompilacje, chociaż ja już nie nadążam :)
UsuńByć może się czepiam, ale... Uważam ze nieładnie jest zwracać się do swego adwersarza ironicznym i w swym zamyśle deprecjonującym określeniem "ekspercie". Mam pytanie: oficjalna 7 z wersji rozwojowej została stabilną przez przypadek (bo równie dobrze stabilną mogły zostać wybrane też inne, -naście kompilacji -do wyboru- z danego miesiąca), czy jednak może coś ją wyróżniało na tle innych "rozwojówek" (np. przeszła pozytywnie procedurę tzw końcowej oceny jakości produktu np pod kątem spójności algorytmu liczącego warianty itp)? Nie sądzę aby decyzja o "ustabilnieniu" którejś kompilacji zapadała przy piwie i na zasadzie wyboru na chybił-trafił; Stocfish to już uznana MARKA - na takie zagrywki decydenci sobie nie mogą pozwolić.
UsuńNa tym właśnie polegają wersje testowe, że coś w nich może nie zagrać. Bywało tak, że np. kompilacja z grudnia wygrywała wyraźnie z tą ze stycznia, ale uzyskiwała słabe wyniki z innymi silnikami!
OdpowiedzUsuńCo do wyboru wersji stabilnej - to właśnie tacy jak my testerzy (choć Stockfish ma swoich lepszych i dużą grupę) wpływają na decyzje co do tego jaka kompilacja może zostać uznana za tą właściwą. Z reguły (i tak chyba było przy numerze 7) pojawia się wersja RC na którą rzucają się testerzy. A potem ona zostaje wersją stabilną.
Bezdyskusyjne jest, że Stockfish 7 jest słabszy od większości nowych kompilacji. W naszym rankingu JCER ma ponad 30 oczek mniej niż najlepsza wersja Stockfisha z 2 marca!