לחובבי גו .... תוכנת גוגל הצליחה לפצח את ‎המשחק

Tenguy

New member
לחובבי גו .... תוכנת גוגל הצליחה לפצח את ‎המשחק


אחרי שכחול עמוק הביס אלופי עולם במשחק שח ....
הגיע עכשיו גם התור למשחק הגו.... מדהים
מעניין אם יקראו ביפן לתוכנה :佐為-AlphaGO


קישורים לניו יורק טיימס ול-The Verge
 

Tenguy

New member
אתמול שוב ניצח alphaGO את אלוף העולם הקוריאני בגו

היום מתקיים המשחק ה-3 בסדרה של 5 משחקים (הנותרים הם מחר ומחרתיים)
למעקב אחר המשחקים (כולל המשחקים שכבר היו) ראו קישור ביוטיוב

לפופולאריות בימינו של משחק הגו ביפן ובשאר העולם המערבי תרמה ללא ספק סדרת המאנגה של היקארו נו גו מסוף שנות ה-90 וכמובן את סדרת האנימה בשנים 2001-2004 ... וכך גם בישראל התחילו בסוף שנות ה-90 לשחק גו והופיעו מועדוני גו וב-1998 הוקמה אגודת הגו הישראלית

.... עוד דוגמא (בגודל אבן גו) קטנה שהחלה להתגלגל מיפן ושינתה שנים ספורות תודעה ותרבות פנאי של מיליוני אנשים בכל העולם
 

herouth

New member
למי שלא עקב אחרי "היקארו נו גו" בזמנה

ראשית, אם אתם תוהים למה בפורום יפן מדברים על תוכנה שניצחה אלוף קוריאני, התשובה הופיעה בסדרה. הגו הומצא בסין, אבל שוכלל לצורתו המודרנית ביפן. במשך שנים היפנים נחשבו למאסטרים הגדולים במשחק, אבל כיום, הקוריאנים הם השליטים הבלתי מעורערים בתחום הזה. אם יש אלוף עולם בגו, מירב הסיכויים שהוא יהיה קוריאני, ואם לא, אז סיני (גם הסינים חזרו לשלוט במשחק יותר מן היפנים). אחת הסיבות לכתיבת המנגה "היקארו נו גו" היתה ניסיון לגרום לילדים היפנים להתעניין שוב במשחק, על מנת להעלות את מאגר השחקנים ולהחזיר עטרה ליושנה.
&nbsp
עכשיו לגבי הסיבה לרעש סביב הניצחונות הללו של הבינה המלאכותית:
&nbsp
העניין הוא, שעל אף שבכל יתר משחקי האסטרטגיה האנושיים הנפוצים, הבינה המלאכותית ניצחה את בני האדם כבר מזמן, גו עדיין נחשב מסובך מדי ועד כה לא הצליחו לבנות מכונות שיצליחו לנצח את רבי-האמנים במשחק זה.
&nbsp
תוכנות לבינה מלאכותית הסתמכו בדרך כלל על אלגוריתם כדוגמת מינימקס, שבו התוכנה מחשבת את כל האפשרויות שניתן להגיע אליהן מהעמדה הנתונה, כולל כל התשובות האפשריות של היריב, כל התשובות האפשריות לתשובות אלה, וכדומה. מתוך כל ה"ענפים" במרחב הזה, היא בוחרת במהלך שמוביל לענף הטוב ביותר האפשרי או לקבוצת ענפים משובחת (שהרי זה גם תלוי בבחירת היריב).
&nbsp
מרחב המצבים הזה הוא ענקי (אקספוננציאלי), ועבור משחקים אמיתיים, לא ניתן לחשב את כולו בזמן סביר. משחק הגו, שמתחיל בלוח ריק, ושהלוח שלו גדול במיוחד (19 על 19) הוא בעל מרחב מצבים גדול בהרבה מזה של שחמט, שהלוח שלו הוא רק 8 על 8 ושמתחיל עם כלים רבים על הלוח, אשר לרובם יש מגבלות על המשבצות שאליהם הם יכולים להגיע, מה שמצמצם את מספר המהלכים האפשריים ועל כן גם הענפים האפשריים בעץ המצבים.
&nbsp
תוכנות שפועלות באסטרטגיה הנ"ל, גם אם יש להן שיטות מתוחכמות לצמצם ענפים מסויימים במרחב המצבים מבלי לפתח אותם עד הסוף, לא יצליחו לנצח בגו. לפחות לא אמנים אמיתיים.
&nbsp
התוכנה AlphaGo, לא הולכת רק בשיטה הזו. היא מתבססת גם על חיפוש מתוחכם בעץ, אבל גם על מה שנקרא "רשתות עצביות עמוקות" - שיטה שבה המכונה לומדת מה נחשב מהלך טוב ומה נחשב מהלך רע באמצעות סריקה של מהלכים שהתבצעו על ידי בני אדם. הדבר דומה למסנני הספאם המודרניים - מסמנים להם אילו הודעות נחשבות ספאם, ואילו לא, ואם הם סימנו הודעה מוטעית כספאם, מסמנים להם שההודעה הזו היא "כשרה" ולהיפך, ועל פי ה"אימון" הזה, הן משפרות את יכולת הבחירה שלהן ומסננות ספאם בעצמן, בלי קריטריונים ברורים כמו כתובת השולח או מילות מפתח בטקסט. הן יוצרות רשת שמייצגת את המכנים המשותפים של כל המצבים הטובים ואחרי מספיק אימונים, יכולות לקבל מצב ולהחליט אם הוא נחשב טוב או לא טוב.
&nbsp
בשיטה הזו אפשר להגיע לתוכנות מחשב שהן טובות כמו בן אדם, אבל אם רוצים לנצח בני אדם, צריך ללכת צעד אחד מעבר לזה, וזה בעצם מה שעשתה התוכנה של גוגל: היא התחילה לשחק מול עצמה, ואימנה את עצמה על בסיס הניצחונות. בכל פעם היא ניצחה את האמן שהיא היתה קודם, ועל כן בעצם הפכה להיות אמן טוב יותר.
&nbsp
AlphaGo השיגה בכך את הגביע הקדוש של הבינה המלאכותית בתחום המשחקים. משחק הגו נחשב עד כה למטרה הבלתי-מושגת, והנה, התוכנה ניצחה כבר במשחק השלישי ברצף מול לי סה-דול.
&nbsp
אגב, מסתבר שגם האינטליגנציה האנושית עובדת, כנראה בשיטה דומה. יריב האימונים של התוכנה, פאן הוי, היה במקום השש-מאות ומשהו בדירוג העולמי כשהתחיל לעבוד איתה. המשחקים מול התוכנה שיפרו את היכולות שלו וכיום הוא מדורג במקום השלוש-מאות ומשהו בעולם, ולטענתו הוא מסוגל היום "לראות" את המשחק הרבה יותר טוב משיכול היה לפני העבודה עם "אלפא גו".
&nbsp
כתבה ב־wired:
&nbsp
http://www.wired.com/2016/03/sadness-beauty-watching-googles-ai-play-go/
&nbsp
הבלוג של גוגל על "איך עובדת תוכנת אלפא גו":
&nbsp
https://googleblog.blogspot.co.il/2016/01/alphago-machine-learning-game-go.html
 

Tenguy

New member
פוסט ממצה ומאיר עיניים .... תודה רבה


ניראה שהשלב הבא יהיה זה שבמדינות המערב המחשבים יעבדו במקום אנשים,
וכדי להימנע מן האבטלה - כל המדינות האלה ישלמו שכר בסיסי לכל אזרח בוגר, כמו בקנדה או בפינלנד
 

herouth

New member
עדכון: האלוף הקוריאני ניצח במשחק הרביעי את התוכנה

מאחר שמדובר בתחרות של הטוב מחמישה, אין לו כמובן סיכוי לנצח בטורניר כולו, אלא שהתחרות איננה רק על הניצחון, אלא על עצם ההתמודדות בין אדם למכונה, ומשום כך, ממשיכים לשחק.

מדעני גוגל אומרים שההפסד היה טוב עבור "אלפא גו", כיוון שהוא הציף בעיה בתוכנה שניתן יהיה לתקן כעת.

וזה מזכיר לי את הפרק ב"היקארו נו גו" שבו סאי סיים לשחק את המשחק הדרמטי נגד המייג'ין - וניצח. סאי מבחינתו מאמין שהוא שיחק את ה"קאמי נו איטה", אבל אז היקארו מתחיל לתאר בהתלהבות את המשחק - ואת הנקודה שבה המייג'ין טעה. מבחינת סאי ההמום, זה אומר שהמהלך שלו לא היה "המהלך האלוהי", אלא פשוט ניצול של טעות, ויתר על כן, שהיקארו ראה את מה שהוא עצמו לא ראה במשחק.

ובכן, גם האלוף הקוריאני שניצח, לא שיחק את ה"קאמי נו איטה", אלא ניצח בשל חולשה של היריב. כך לפי הצוות של גוגל.
 

Tenguy

New member
ממש נכון
זה באמת מזכיר את המשחק של סאי מול טויה מייג׳ין

 

Tenguy

New member
משחקים הסתיימה בתוצאה 4-1 לטובת GoogleAlpha

המשחק האחרון התעלה על כולם .... זה היה משחק לוחמני מכלתחילתו, שדווקא GoogleAlpha טעה "טעות משמעותית" בתחילת המשחק - טעות אותה הקוריאני דאן-9 סה-דול ניצל לטובתו, אך GoogleAlpha לחם וביצע "תחיית מתים" או "שיבה לחיים" (Come backׂׂׂ) וניצח את האלוף הקוריאני במשחק ארוך שנמשך הרבה מעבר למגבלת השעון.

תגובה בטוויטר מיצתה את המשחק הזה במילים הבאות:
#AlphaGo wins game 5! One of the most incredible games ever. To comeback from the initial big mistake against Lee Sedol was mind-blowing!!!
Demis Hassabis - Founder & CEO, DeepMind.
 

herouth

New member
גם זה מזכיר לי קטע מהיקארו

כשהיקארו עצמו עושה טעות באחד המשחקים החשובים שלו. וסאי עומד בצד ומהרהר לעצמו: "יש דרך לשרוד, דרך קשה וארוכה, האם היקארו ימצא את הדרך הזו?", ובסוף אכן היקארו מוצא את הפיתרון ומנצח.
&nbsp
אבל במקרה של אלפא-גו, השאלה הגדולה היא אם באמת זו היתה טעות? האם יכול להיות שאלפא-גו ראה בעץ החיפוש שלו שהמהלך הזה מוביל בסופו של דבר לניצחון, ולכן מבחינתו זה היה מהלך מנצח, אף על פי שמבחינת שחקן אנושי, זה מהלך שגוי?
 

The MarBar

New member
אי אפשר ממש לדעת

יש שם רשת נוירונים גדולה, זה סוג של קופסה שחורה שאי אפשר ממש להבין מה קורה בתוכה. בנוסף, אימנו את הרשת גם ממשחקים של בני-אדם וגם ממשחקים של התוכנה מול עצמה - מה שמתקבל זה מעין שילוב של משהו שיודע לשחק מול בני אדם לבין משהו שיודע לשחק מול עצמו (או מול לא-בני-אדם, או שסתם זה מאפשר לו לראות יותר מצבים בשלב האימון).
הרעיון באלגוריתמי למידה (לעומת עץ חיפוש) הוא שאפשר לנחש לגבי מצבים שלא ראית לעולם מתוך ״הבנה״ שפיתחת על מצבים שכן ראית. אם המהלך ״טעות״ הוא לא מהלך שהוא ראה אף פעם יהיה מאוד מאוד קשה להבין למה הוא למד לבצע אותו. בנוסף, תיאורטית לא ברור לי שקיים מהלך שהוא טעות.
 
למעלה