LINUXSOFT.cz Přeskoč levou lištu
Uživatel: Heslo:  
   CZUKPL

> Šachové myšlení (1) - nejjednodušší program

V novém seriálu vítám všechny příznivce počítačového šachu. Pokud chcete vědět, co je to alfabeta, historická heuristika nebo metoda nulového tahu, čtěte dále.

8.3.2006 09:00 | Jan Němec | Články autora | přečteno 31830×

Šachové myšlení počítače

Šachy jsou určitě nejznámější deskovou hrou dvou hráčů, mají poměrně jednoduchá, přesně definovaná a již delší dobu neměnná pravidla, která je možné bez větších problémů implementovat na počítači. Narozdíl od většiny karetních her mají oba hráči v šachách úplnou informaci o aktuální pozici (žádné zakryté karty soupeře) a do výsledku partie nevstupuje z vnějšku náhoda (žádné rozdávání karet). Z těchto důvodů jsou šachy nejen hrou, ale i oblíbeným mentálním cvičením jak mozků přírodních, tak i těch umělých.

Lidé se snažili vyrobit šachové programy odedávna, prvním známějším pokusem byl malý technický zázrak - automat z konce 18. století s figurkou Turka, která pohybovala kameny na šachovnici. Jednalo se pochopitelně o podvod, v přístroji byl ukrytý šachista člověk. Serióznější pokusy, včetně například přístroje pro hraní koncovky krále s věží proti králi nebo dokonce ručně simulovaného algoritmu pro celou hru pocházejí až ze století dvacátého. S rozvojem počítačů posloužily šachy jako jeden z testů jejich inteligence. Díky vývoji šachových algoritmů a neustálému zlepšování hardware začaly programy postupně porážet úplné začátečníky, kavárenské i klubové hráče, oddílové přeborníky i mistry. Dál už to šlo pomalu a na úroveň nejlepších světových velmistrů se špičkové programy dostávají teprve v současnosti. I když známá porážka Kasparova Blue Deepem v zápase v roce 1997 byla jen první vlaštovkou, která přiletěla trochu předčasně, je zřejmé, že za několik desetiletí již člověk nebude hře počítačů rozumět.

Dnes to zní směšně, ale ještě zhruba před dvaceti lety si hodně lidí myslelo, že počítače nikdy nebudou hrát šachy lépe než lidé, protože prý

  • Tvůrčí myšlení není možné emulovat algoritmickým myšlením počítačů.
  • Pro hraní šachů je třeba tvůrčí myšlení.

První tvrzení definitivně padne, až budou počítače psát hodnotné romány (nebo zpočátku alespoň generovat telenovely). Nepravdivost druhého tvrzení si ukážeme v našem seriálu. Jinými slovy nepopiratelná kvalita současných šachových programů ukazuje především to, že šachy nejsou dobrým testem inteligence.

Celou řadu algoritmů, kterou zde uvedu, lze aplikovat i na jiné hry dvou osob. Seriál tak lze tedy chápat i jako obecný návod pro naprogramování dámy, piškvorek a podobně. Šachy však zůstanou hlavním cílem a některé postupy ani zobecnit na ostatní hry nepůjdou.

Nejjednodušší program

Nejprve je třeba navrhnout základní datové struktury a rutiny jako je vyhledání všech legálních tahů z pozice, provedení a vrácení tahu, detekce matu a remíz a podobně. Podobné rutiny musí obsahovat každý šachový program, i když neobsahuje myslící algoritmus, ale jen například umožňuje hru dvou lidských hráčů přes síť a kontroluje tahy. Kvalitní implementace myslícího algoritmu tyto rutiny obsahuje rovněž, ale zpravidla poměrně komplikované, především kvůli optimalizaci na rychlost nebo proto, že jako vedlejší efekt provádějí i jinou akci. Na začátek proto budeme předpokládat, že zmíněné rutiny máme již nějak napsané (to jistě dokáže každý programátor seznámený s pravidly šachů) a teprve v dalších dílech si o nich povíme víc.

Asi nejjednodušší algoritmus, který nehraje úplně náhodně a aspoň trochu přemýšlí, bude založený na porovnávání pozic po zahraném tahu. Především musíme implementovat statickou ohodnocovací funkci. Tato funkce má na vstupu pozici a výstupem je číslo, které určuje, jak moc je pozice dobrá pro hráče, který je právě na tahu. Funkce nemá příliš velké ambice a provádí jen velmi jednoduchou analýzu pozice. Její nejdůležitější a nejjednodušší složkou je prostý součet materiálu. Pokud má pěšec cenu 1, jezdec se střelcem 3, věž 5 a dáma 9. Uvedené hodnoty jsou samozřejmě jen orientační. Číselně málo významnou, ale pro úroveň hry podstatnou složku tvoří pozice. Každý šachista ví, že věž patří na volný sloupec (např. +0,1), dvojpěšec je horší než dva pěšci (třeba -0,3), izolovaný pěšec také není dobrý (-0,1), střelec může z g5 svázat jezdce na f6 (+0,05) a podobně. Hodně věcí se dá uložit do tabulek. Třeba jezdci můžeme pro každé políčko přiřadit bonus nebo postih. Podrobnosti statické ohodnocovací funkce nás zatím nebudou zajímat, vrátíme se k ní v dalších dílech. Důležité je jen to, že funkce provádí jen jakousi velmi rychlou a zběžnou analýzu pozice a nesnaží se například vyřešit, zda s tím chyceným střelcem na a7 bílý uteče. Je zřejmé, že i statickou ohodnocovací funkci dokáže napsat každý šachista - programátor, byť jistě ne na špičkové úrovni.

Nyní je již vlastní algoritmus velmi jednoduchý. Vygenerujeme ze zadané pozice všechny tahy a zkoušíme jeden po druhém zahrát. Vzniklou pozici vždy ohodnotíme statickou ohodnocovací funkcí a tah vrátíme. Průběžně si pamatujeme nejlepší tah a rovněž hodnotu pozice, ke které vede. Po otestování všech vygenerovaných tahů vrátíme ten nejlepší.

Můžeme zkusit ručně odsimulovat chod algoritmu pro základní postavení. Na tahu je bílý. Generátor tahů pravděpodobně projde políčka od a1 po h8 a pro každý bílý kámen nalezne jeho tahy. Ty přijdou v pořadí Ja1, Jc3, Jf3, Jh3, a3, a4, b3, b4, ..., h3, h4. Program zkusí zahrát Ja1 a vzniklou pozici ohodnotí statickou ohodnocovací funkcí. Zjistí, že si tahem moc nepolepšil, neboť v tabulkách ohodnocovací funkce bude pro jezdce na a1 malé číslo, jezdec nestojí u kraje šachovnice příliš dobře. Žádný jiný tah však zatím nemá, tak si Ja1 zapamatuje, jako dosavadní nejlepší, a uloží si i hodnotu pozice. Poté program tah vrátí, takže vznikne opět základní postavení. Zahraje Jc3 a statickou ohodnocovací funkcí zjistí, že výsledná pozice je pro bílého lepší než hodnota po Ja1. Klíčovou roli opět sehrají tabulky statické ohodnocovací funkce pro jezdce. Program tedy přepíše proměnné pro nejlepší tah i pro jeho hodnotu na Jc3 a cenu takto vzniklé pozice. Vrátí tah a pokračuje v propočtu. Hned další tah Jf3 bude zřejmě nepatrně lepší než Jc3, takže opět přepíše proměnné pro nejlepší tah a jeho hodnotu. Pozici po Jh1 naproti tomu zavrhne, neboť je horší než dosavadní maximum po Jf3. Stejným způsobem program ohodnotí i všech 16 tahů pěšci. Zde nejspíš statická ohodnocovací funkce ocení kontrolu centra po d4 a e4. Jako výsledný nejlepší tah, tak program zřejmě vrátí d4. Tento zahajovací tah je oblíbený i lidskými hráči od amatérů až po velmistry. V základním postavení tedy náš jednoduchý program nezklamal.

V jakémsi pseudokódu ve stylu C by algoritmus vypadal zhruba následovně.

Tah nejlepsiTah(Pozice p) {
  Tahy t;
  int i, indexNejlepsiho;
  int cena, nejlepsi;

  t = generujTahy(p);
  nejlepsi = -NEKONECNO;

  for (i = 0; i < tahy.pocet; i++) {

    zahrajTah(p, t[i]);
    cena = -hodnotaPozice(p);
    zahrajTahZpet(p, t[i]);

    if (cena > nejlepsi) {
      nejlepsi = cena;
      indexNejlepsiho = i;
    }

  }
  return t[indexNejlepsiho];
}

Co reprezentují typy Tah a Pozice asi nemusím vysvětlovat. Tah může být číslo nebo jednoduchá struktura nesoucí dostatečné informace pro provedení a vrácení tahu v konkrétní pozici. Je dobré si uvědomit, že pravidla šachu obsahují několik speciálních typů tahů. Mám na mysli rošádu, braní mimochodem a proměny pěšců. Kvůli tomu není provedení a vrácení tahu tak jednoduché, jak by jinak mohlo být. Proměna pěšce ovlivní i samotný typ Tah, musím do něj nějak zakódovat, zda se pěšec při tahu na poslední řadu mění v dámu, věž, střelce nebo jezdce. Nestačí si tedy pamatovat jen políčka odkud a kam se táhne. Typ Tahy používám jako pole Tahů vylepšené o položku pocet, která označuje velikost pole. Pozice bude struktura obsahující rozestavěné kameny na šachovnici - dvourozměrné pole 8 x 8 (později si ukážeme implementaci s mantinelem - pole 10 x 12) a také informaci o možnostech braní mimochodem a zkažených rošádách. Pro nešachisty připomínám, že braní mimochodem je možné pouze bezprostředně poté, co soupeř táhl pěšcem o dvě pole a že rošádu není možné provést, pokud hráč již táhl králem nebo příslušnou věží, ani když se potom vrátil na původní pole.

Význam funkcí generujTahy, zahrajTah a zahrajTahZpet je snad zřejmý, hodnotaPozice je statická ohodnocovací funkce. Hodnotu pozice (včetně materiálu) počítáme v typu int, cena jednoho pěšce může být třeba 100. Hodnota je vždy z hlediska hráče, který je právě na tahu, větší číslo znamená lepší pozici. Zahrání neutrálního tahu tak jen změní znaménko hodnoty pozice, proto v kódu přiřazuji cenu pozice se znaménkem minus.

Pokračování příště

Uvedený program je sice lepší než náhodný výběr tahů, ale díru do světa rozhodně neudělá. Porovnává pozice vzniklá po jediném půltahu, a tak klidně sebere dámou krytého pěšce, nepokryje jednotahový mat a podobně. Asi každého programátora, který někdy slyšel o rekurzi, napadne okamžitě zlepšení. Ukážeme si ho v příštím dílu.

Verze pro tisk

pridej.cz

 

DISKUZE

Počítačový šach v LE 8.3.2006 09:23 Lukáš Zapletal
L Re: Počítačový šach v LE 8.3.2006 09:33 o.k.
  L Re: Počítačový šach v LE 9.3.2006 15:27 Lukáš Zapletal
    L Re: Počítačový šach v LE 9.3.2006 15:49 Jan Němec
rocháda - drobné doplnění 8.3.2006 11:35 camlost
|- Re: rocháda - drobné doplnění 8.3.2006 11:58 Jan Němec
L Re: rocháda - drobné doplnění 8.3.2006 17:59 Petr Zajíc
Úvodní tahy 8.3.2006 18:01 Petr Zajíc
L Re: Úvodní tahy 9.3.2006 08:24 Jan Němec
no tak... 9.3.2006 19:13 Birkof




Příspívat do diskuze mohou pouze registrovaní uživatelé.
> Vyhledávání software
> Vyhledávání článků

5.3.2017 19:12 /Redakce Linuxsoft.cz
PR: 23. března proběhne v Praze konferenci na téma Cloud computing v praxi. Hlavními tématy jsou: Nejžhavější trendy v oblasti cloudu a cloudových řešení, Moderní cloudové služby, Infrastruktura současných cloudů, Efektivní využití cloudu, Nástrahy cloudových řešení a jak se jim vyhnout.
Přidat komentář

27.2.2017 22:12 /František Kučera
Pozvánka na 137. sraz OpenAlt – Praha: Tentokrát jsme si pro vás připravili neobvyklou akci. Ve středu 1.3. v 17:30 nás přivítá sdružení CZ.NIC ve svých prostorách v Milešovské ulici číslo 5 na Praze 3, kde si pro nás připravili krátkou prezentaci jejich činnosti. Následně navštívíme jejich datacentrum pod Žižkovskou věží. Provedou nás prostory, které jsou běžnému smrtelníkovi nedostupné!
Po ukončení prohlídky se všchni odebereme do hostince U vodoucha, Jagelonská 21, Praha 3 pochutnat si na některém z vybraných piv či dát si něco na zub. Rezervaci máme od 19:30, heslo je OpenAlt.
Ale pozor! Do prostor datového centra máme omezený přístup, dostane se tam pouze 10 lidí! Takže kdo přijde dříve, ten má přednost, a občanky s sebou! Kdo nebude chtít na prohlídku datového centra, může se pomalu přesunout do hostince U vodoucha a u nepřeberné nabídky piv počkat na ostatní.
Přidat komentář

18.1.2017 0:49 /František Kučera
Členové a příznivci spolku OpenAlt se pravidelně schází v Praze a Brně. Fotky z pražských srazů za uplynulý rok si můžete prohlédnout na stránkách spolku. Příští sraz se koná už 19. ledna – tentokrát je tématem ergonomie ovládání počítače – tzn. klávesnice, myši a další zařízení. Také budete mít příležitost si prohlédnout pražský hackerspace Brmlab.
Přidat komentář

8.1.2017 17:51 /František Kučera
Máš rád svobodný software a hardware nebo se o nich chceš něco dozvědět? Přijď na sraz spolku OpenAlt, který se bude konat ve čtvrtek 19. ledna od 18:30 v pražském hackerspacu Brmlab. Tentokrát je tématem srazu ergonomie ovládání počítače – tzn. klávesnice, myši a další zařízení. K vidění bude mechanická klávesnice dasKeyboard, trackball Logitech nebo grafický tablet (a velký touchpad) Wacom. Přineste i vy ukázat svoje zajímavé klávesnice a další HW. V 18:20 je sraz před budovou, v 18:30 jdeme společně dovnitř, je tedy dobré přijít včas. Podle zájmu se později přesuneme do nějaké restaurace v okolí.
Přidat komentář

1.12.2016 22:13 /František Kučera
Máš rád svobodný software a hardware nebo se o nich chceš něco dozvědět? Přijď na sraz spolku OpenAlt, který se bude konat ve čtvrtek 8. prosince od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Sraz bude tentokrát tématický. Bude retro! K vidění budou přístroje jako Psion 5mx nebo Palm Z22. Ze svobodného hardwaru pak Openmoko nebo čtečka WikiReader. Přijďte se i vy pochlubit svými legendami, nebo alespoň na pivo. Moderní hardware má vstup samozřejmě také povolen.
Komentářů: 1

4.9.2016 20:13 /Pavel `Goldenfish' Kysilka
PR: Dne 22.9.2016 proběhne v Praze konference Cloud computing v praxi. Tématy bude např. nejnovější trendy v oblasti cloudu a cloudových řešení, provozování ERP v cloudu, o hostování různých typů softwaru, ale třeba i o zálohování dat nabízeném podnikům formou služby.
Přidat komentář

1.9.2016 11:27 /Honza Javorek
Česká konference o Pythonu, PyCon CZ, stále hledá přednášející skrz dobrovolné přihlášky. Máte-li zajímavé téma, neváhejte a zkuste jej přihlásit, uzávěrka je již 12. září. Konference letos přijímá i přednášky v češtině a nabízí pomoc s přípravou začínajícím speakerům. Řečníci mají navíc vstup zadarmo! Více na webu.
Přidat komentář

27.8.2016 8:55 /Delujek
Dnes po 4 letech komunitního vývoje vyšla diaspora 0.6.0.0
diaspora* je open-source, distribuovaná sociální síť s důrazem na soukromý
Více v oficiálním blog-postu
Přidat komentář

   Více ...   Přidat zprávičku

> Poslední diskuze

24.3.2017 11:54 / Hui
country cottages

16.3.2017 16:33 / BezvaDesign.cz
Re: Hledám grafika do teamu

9.3.2017 11:44 / Jaromir Obr
Re: chyba

18.1.2017 20:18 / martin horky
Spolupraca linuxu a microsoftu

17.1.2017 9:57 / Pavel Hrubeš
Re: Externí USB televizní karta

Více ...

ISSN 1801-3805 | Provozovatel: Pavel Kysilka, IČ: 72868490 (2003-2017) | mail at linuxsoft dot cz | Design: www.megadesign.cz | Textová verze