wtorek, 12 kwietnia 2016

Stockfish 7 wygrał turniej testowy nowych silników szachowych Jurek Chess Engines Rating, 2016.04.09 - 2016.04.10


Games downloadTempoHardwareSystem
180 games3' + 3"Intel(R) Core(TM) i7-4710MQ CPU @ 2.50GHz z 7,9 GBWindows 10 64 bit
DOWNLOAD
BookGUIJCER Games Tabela
Perfect 2015Arena 3.5.1106.606 games downloadScid vs PC

Okazało się, że "stary" Stockfish 7 jest lepszy od kompilacji kwietniowych!
Ale zwracam uwagę na silnik Soberango. Jeszcze niedawno, w pierwszym swoim teście uzyskał wynik = zero!
A tu jako jedyny wygrał partię ze zwycięzcą a ponadto naskubał wiele punktów z innymi Stockfishami.
Za to przegrał aż trzy razy ze słabiutkim Sayuri!
Niesamowita huśtawka wyników. Zobaczymy jak będą rozwijać się kolejne wersje.
A i nowy klon Raubfish - na miejscu czwartym.



4 komentarze:

  1. "Okazało się, że "stary" Stockfish 7 jest lepszy od kompilacji kwietniowych!"- i to jest odpowiedź na pytanie dlaczego "tu i ówdzie" jest testowana 7 a nie wersje rozwojowe. Wersje rozwojowe mają krótkie żywoty, zmieniają się co chwila i tak naprawdę nie dają możliwości wiarygodnej oceny ich siły gry jeżeli nie są testowane razem z 7. W tym turnieju widać że planowany "rozwój" tak naprawdę był zepsuciem produktu wyjściowego... (przy założeniu że punktem wyjścia była 7 i to ona miała być "poprawiana i rozwijana")

    OdpowiedzUsuń
    Odpowiedzi
    1. Drogi ekspercie. Niedawno był tutaj prezentowany turniej, gdzie kompilacje z marca zlały jak chłopca Stockfisha 7. Pewnie wiesz, że Stockfish 7 to tak naprawdę wersja rozwojowa, która została przez autorów przemianowana na "stabilną". To dobrze że ktoś dla nas testuje te nowe kompilacje, chociaż ja już nie nadążam :)

      Usuń
    2. Być może się czepiam, ale... Uważam ze nieładnie jest zwracać się do swego adwersarza ironicznym i w swym zamyśle deprecjonującym określeniem "ekspercie". Mam pytanie: oficjalna 7 z wersji rozwojowej została stabilną przez przypadek (bo równie dobrze stabilną mogły zostać wybrane też inne, -naście kompilacji -do wyboru- z danego miesiąca), czy jednak może coś ją wyróżniało na tle innych "rozwojówek" (np. przeszła pozytywnie procedurę tzw końcowej oceny jakości produktu np pod kątem spójności algorytmu liczącego warianty itp)? Nie sądzę aby decyzja o "ustabilnieniu" którejś kompilacji zapadała przy piwie i na zasadzie wyboru na chybił-trafił; Stocfish to już uznana MARKA - na takie zagrywki decydenci sobie nie mogą pozwolić.

      Usuń
  2. Na tym właśnie polegają wersje testowe, że coś w nich może nie zagrać. Bywało tak, że np. kompilacja z grudnia wygrywała wyraźnie z tą ze stycznia, ale uzyskiwała słabe wyniki z innymi silnikami!
    Co do wyboru wersji stabilnej - to właśnie tacy jak my testerzy (choć Stockfish ma swoich lepszych i dużą grupę) wpływają na decyzje co do tego jaka kompilacja może zostać uznana za tą właściwą. Z reguły (i tak chyba było przy numerze 7) pojawia się wersja RC na którą rzucają się testerzy. A potem ona zostaje wersją stabilną.
    Bezdyskusyjne jest, że Stockfish 7 jest słabszy od większości nowych kompilacji. W naszym rankingu JCER ma ponad 30 oczek mniej niż najlepsza wersja Stockfisha z 2 marca!

    OdpowiedzUsuń