FST - התשובה של פרופ' גרייבס

FST - התשובה של פרופ' גרייבס

בדיון האחרון עלתה שאלה לגבי מדד FST לקביעת גזעים ובמיוחד לגבי בני אדם מודרניים.
לחבר הפורום צ'ארלס היתה השגה לגבי למה חוקר כמו גרייבס משתמש בכלל ב FST והאם הוא משתמש במדד בהתאם לכוונה של סיוול רייט.
רק-עובר טען שהשימוש המקורי במדד נחשב למיושן ויש מחלוקת, גם עפ"י רייט עצמו, לגבי האפליקטיביות שלו בעולם האמיתי.
הפניתי את השאלה לפרופ' גרייבס וכפי ששערתי הוא הואיל בטובו לענות תשובה מפורטת.
אשמח לשמוע את השגות מומחיינו בנושא (גרייבס קלט שאני בור גדול בגנטיקה של אוכלוסיות) ואנסה להעביר לגרייבס אם יהיה טעם.

In answer to your question below. The Hartl and Clark description of Fst relation to genetic variation is correct. Thus, when we are talking about the biological definition of race we are concerned with how much variation exists between populations that we suspect are geographic races. This is true of all species (not just humans.) Thus, when Sewall Wright proposed in 1968 that the lowest threshold for the existence of a biological or geographic race as Fst = 0.250, he was saying that we describe populations that have very great genetic differentiation as biological or geographic races.

The socially-defined groups within our species (anatomically modern humans) do not have any where near that much differentiation averaged across the genome. This is why I categorically state that our species does not have biological races. Socially-defined races differ by historical period and society. For example in Brazil, there are at least 12 categories of persons who have African descent. These categories are real and meaningful within Brazilian society, so a "moreno" differentiates themselves from a "clara." In the United States both groups would be called "black" or "African American."

While I have stated above that the average Fst for the human genome does not approach 0.250, there are specific loci which do exceed the 0.250 figure. Anything which is subject to strong natural selection associated with a geographic cline (such as sunlight) is likely to have a strong Fst value. Skin color associated loci have large Fst values, but remember there are only five (of 25,000 coding loci) that code for skin color. This is why geneticists like Rick Kittles (U. Chicago) and Ken Shriver (Penn. St.) can utilize specific genetic markers to estimate the amount of continental ancestry that individuals have. These are called ancestry informative markers (AIMs), and they have been used to estimate the percentage of European genes in African Americans (~ 16% by region.) The percentage of AIMs in the entire human genome are less than 5% of its composition.

You are correct that intelligence is a complex trait with very many genetic loci contributing to it. I have pointed our for a long time that intelligence is not racialized. I have chapters on this in both of my books, The Emperor's New Clothes: Biological Theories of Race at the Millennium, Rutgers U. Press 2005 and The Race Myth: Why We Pretend Race Exists in America, Dutton Books, 2005. I just wrote a piece on the genomics of intelligence that will be coming out later this year from Nova Press. You incorrect in asserting that one cannot study the Fst associated with genetic variation that has been associated with intelligence. A large number of genetic markers have been related to high intellectual performance and each of these has a very large number of single nucleotide polymorphisms (SNPs) within them. In the Nova chapter I analyzed the Fst for these genetic variants and found that 95% had Fst below 0.250. In other words genes associated with cognitive function have Fst distributions just like the rest of the human genome.

In summary, I strongly recommend that you actually read my books on biological conceptions of race (as opposed to snippets taken from Utube.) I think you misunderstood my views. In addition, it would profit you to take a course in evolutionary or population genetics, because you cannot understand the genetic/genomic issues associated with race, without that type of training.

Sincerely,

Dr. Joseph L. Graves Jr.
Assoc. Dean for Research
JSNN
Greensboro, NC 27401

שאלת ההדיוט:

Hello Prof. Graves,

In one of your talks, Spelman College Oct 2012, you mentioned that “Sewall Wright felt that Fst = 0.25 was required to define geographic races and subspecies”:
http://www.youtube.com/watch?feature=player_detailpage&v=cF4VxSA3zVQ#t=1463s

After some web research I found the following definition that is attributed to Wright (Hartl and Clark 1989. p118-119):
The range 0 to 0.05 may be considered as indicating little genetic differentiation.
The range 0.05 to 0.15 indicates moderate genetic differentiation.
The range 0.15 to 0.25 indicates great genetic differentiation.
Values of FST above 0.25 indicate very great genetic differentiation.

Is this consistent with the 0.25 claim that you have mentioned during the talk?
Why FST is actually important for defining human races for which the only phenotype that matters is the cognitive one for which, as far as I can tell, we don’t know the FST?

For example, I saw claim that the FST for skin color has been estimated to be about 0.6 (Relethford, J.H. 1992) yet no one is going use this trait to define races.

I hope that you will be able to find time to address my questions.

Thanks,
Rani
 

עמיקם10

New member
שאלה-צבי ינאי כותב בספרו ש..

דוב הקוטב פיתח תכונות להישרדות כמו שכבת שומן עבה.צבע לבן. שבהתחממות הקטב יקשו עליו להתמודד עם הדוב החום הזריז יותר.
מה זה אומר 'פיתח' ?
 
"פיתח" זה קיצור מקובל אך מטעה

לביטוי "התפתחה אצלו באופן אבולוציוני". פופולריזטורים (כמו ינאי) וגם הרבה ביולוגים משתמשים בניסוח המקוצר כי הוא פחות מסורבל, אבל כמובן הקורא עלול להבין ממנו שדובי קוטב עוסקים בהנדסה גנטית של עצמם. במאמרים מדעיים רשמיים ובספרי לימוד משתדלים להימנע מהניסוח המקוצר והמטעה.
 
ויכוח משעשע

יש לציין שלא זכור לי שנתקלתי בשמו של גרייבס עד השבוע, וגם לא בשמות שני הספרים שלו. גם לא זכור לי שנתקלתי באיזשהו מאמר שמדד FST בבני-אדם ע"מ להשוות אותו לסף כלשהו (0.25 או אחר) ולקבוע על פי זה שבני אדם מחולקים או לא מחולקים לגזעים. לפחות בעשור האחרון השוואה כזו תהייה די חסרת-טעם, לאור הממצא הברור שרוב ההבדל ב-FST בין אוכלוסיות אנושיות הוא תוצר לוואי של איבוד שונות גנטית עם ההתרחקות מאפריקה.

לכן נראה שנשארנו בעיקר עם ויכוח אישי בין גרייבס וגותרום מי ציטט נכון יותר את עמדתו ההיסטורית של סיוול רייט. עד כמה שאני מבין את התשובה של גרייבס, הוא לא חולק על סולם ה-"קטן, בינוני, גדול, גדול מאוד" שמצוטט מתוך הספר של רייט מ-1978, אבל טוען שבפרסום יותר מוקדם מ-1968 רייט קבע את הסף לחלוקה לתת-מינים ל- 0.25. למי שבאמת איכפת מי מהשניים צודק (לי לא) הכי עדיף זה פשוט ללכת לספריית אוניברסיטה ולבדוק במקורות מה רייט באמת כתב.

כמובן, עפ"י לונג וקיטלס יכול להשתמע גם שרייט עצמו שינה את דעתו בין 68 ל-78, אחרי שגילה שבמקרים מסויימים FST מקבל ערכים מקסימלים נמוכים בהרבה ממה שהוא אמור לקבל.
 

Charles Darwin

New member
רייט כתב שחור ע"ג לבן ב-1978 שאין בכלל שאלה -

ברור שיש גזעים באדם. אבל הוא לא הסתמך על Fst אלא על הקריטריון האוניברסלי ה*אמיתי* המקובל (שניתן להבחין בין פרטים מקבוצות שונות).

"גם לא זכור לי שנתקלתי באיזשהו מאמר שמדד FST בבני-אדם ע"מ להשוות אותו לסף כלשהו (0.25 או אחר) ולקבוע על פי זה שבני אדם מחולקים או לא מחולקים לגזעים."

זה שאתה לא מכיר לא אומר שהם לא קיימים. הם קיימים והם מאוד משמעותיים (עובדה שגרייבס הסתמך עליהם).

"לפחות בעשור האחרון השוואה כזו תהייה די חסרת-טעם, לאור הממצא הברור שרוב ההבדל ב-FST בין אוכלוסיות אנושיות הוא תוצר לוואי של איבוד שונות גנטית עם ההתרחקות מאפריקה."

אין שום הבדל פשטני שכזה בין צבירת Fst ע"ע איבוד שונות לעומת צבירת Fst ע"י התווספות שונות. אם כבר אז אפשר להגיד שלהיפך - דווקא איבוד שונות עשוי לנבוע (באופן חלקי) מסלקציה. רוב ההבדלים בין גזעי הכלבים, למשל, הם כנראה כתוצאה מאיבוד שונות. לפי ההגיון שלך זה חסר טעם להניח שיש הבדלים בין גזעי כלבים - אולם בפועל מדובר על הבדלים שגדולים אולי בעשרות מונים מאשר מה שמקובל כדי להבדיל בין תתי-מין. נראה אותך מוצא מאמר אחד שתומך בעמדה שלך שעליה ב-Fst בגלל איבוד של שונות היא פחות משמעותית אפילו בפרומיל מאשר עליה ב-Fst כתוצאה מצבירת שונות חדשה.

"למי שבאמת איכפת מי מהשניים צודק (לי לא)"

אם לרני (שנמצא בצד שלך עקרונית) זה היה מספיק חשוב כדי לשלוח מייל לגרייבס, אולי זה לא כזה עניין פעוט כפי שאתה מנסה להציג את זה.

"עפ"י לונג וקיטלס יכול להשתמע גם שרייט עצמו שינה את דעתו בין 68 ל-78"

הוא לא שינה את דעתו - הציטוט שנתתי הוא מ-1978.

ובאשר ללונג וקיטלס - לקבוע ש-Fst הוא מדד בעייתי בגלל שהוספת מספר קטן של שימפנזים למדגם משנה רק בקצת את ה-Fst זה בערך כמו לטעון שכסף הוא מדד בעייתי בגלל שהכנסת ביל גייטס ווורן באפט למדד ההכנסה החודשית באמריקה משנה רק בקצת את הממוצע. אין לי מושג איך זה עבר ביקורת עמיתים.

לפחות גילית שכל הביקורת הפופולרית נגד Fst היא על כך שהמדד הזה עשוי *להמעיט* בדיפרנציאציה, ואף פעם לא על כך שהוא מפריז בה. בנוסף לביקורת של ג'וסט יש שתי ביקורות נוספות (אחת מהן של ג'ון הוקס) שמדגימות דרכים נוספות שבהן Fst עשוי להמעיט בדיפרנציאציה. לכן, כאמור, הביקורות הנ"ל חביבות דווקא על הגזענים, ולכן אתה בשום אופן לא יכול להשתמש בהן כדי לנסות למזער את ההבדלים בין הגזעים, גם אם אתה ממש ממש רוצה.
 
FST להדיוטות?

יש מצב לקבל הסבר קטן על FST לא רק בקשר לאדם.

מה מדד זה בא למדוד ולמה זה חשוב?
איך המדידה מתבצעת (קונספטואלית)?
מהי הבעייתיות שרייט הצביע עליה או הלקויות של המדד?
מהם שיפורים אפשריים ל FST או שיטות אלטרנטיביות?

גרייבס (ומאמר נוסף שהזכרתי) ציין ש FST לגנוטיפ של צבע עור הוא אכן גבוה כפי שזה בא לידי ביטוי בפנוטיפ.

איך זה אמור לעבוד עבור המדד היחיד שרלוונטי לגבי בני אדם - הפנוטיפ הקוגניטיבי?

גרייבס טוען שFST של הגנוטיפ הקוגנטיבי הוא דומה לFST הכללי - הרבה פחות מ 0.25 אבל מה זה בכלל אומר על הפנוטיפ הקוגנטיבי שלא ממש ברור איך הוא נגזר מהגנוטיפ?

כלומר יכול להיות הבדל בגנוטיפ הקוגנטיבי ללא הבדל בפנוטיפ כפי שהוא בא לידי ביטוי בחיי היומיום.

מעניין למשל לדעת מה FST של גנוטיפ קוגניטיבי בין נשים לגברים כאשר ידוע שהמוחות שונים במקצת בגודל ממוצע ומבנה בעוד שבחברה המודרנית מניחים שאין ממש הבדל בפוטנציאל הקוגניטיבי בממוצע.
 
באופן כללי ויקיפדיה נותנת הסבר סביר

יש גם ברשת הסברים יותר טובים. כדאי מאוד להבין ניתוח שונות ANOVA (לא רק בשביל FST אגב, זה כיום אחת השיטות הסטטיסטיות החשובות ביותר במדע).

רייט בכלל פיתח במקור את המדד לצרכים אחרים, אבל בגלגולו האחרון הוא נועד למדוד באיזה מידה אוכלוסיות אכן שונות זו מזו, או שייכות בעצם לאותה האוכלוסיה.

בעיקרון מודדים שכיחות של פנוטיפים (אם זה FST פנוטיפי) או אללים (FST גנוטיפי) ובודקים איזה חלק של השונות הכללית שלהם נמצא ברמת האוכלוסיה ואיזה ברמת הפרטים. FST אמור לנוע מ-0 (כל השונות היא בין פרטים ואין הבדל בין אוכלוסיות) ל-1 (כל השונות היא בין אוכלוסיות ולכן הן נפרדות לחלוטין זו מזו). את הניתוח הזה אפשר לעשות לכל אתר גנטי לחוד, או על פני אתרים רבים.

מה שויקיפדיה קצת מפספסת זה שהתאוריה של FST עושה לא מעט הנחות (גלויות וסמויות). כאשר ההנחות לא מתקיימות במציאות FST מתפרע. לפי לונג וקיטלס (לא בדקתי) רייט עצמו כבר מראה בספר מ-1978 דוגמה מספרית של שתי אוכלוסיות שהן נפרדות לחלוטין וצריכות בתאוריה לקבל FST של 1, אבל באופן מעשי מקבלות רק שליש. בין אם זה נכון ובין אם לא, אין ספק שקמו בעשרות השנים האחרונות לא מעט מדדים שמתקנים או מחליפים את FST בצורות שונות. אף אחד מהם לא אידאלי ולא השתלט על כל התחום, לכן פרקטיקה מקובלת במאמרים בימינו היא לדווח על אחד המדדים החדשים, ובמקביל לדווח גם על FST כך שניתן יהיה להשוות עם מאמרים קודמים ואחרים.

בנוסף יש את הויכוח האם ואיזה ערך-סף של FST מראה על הפרדה משמעותית אבל לא מושלמת, היינו "תת-מינים" או "גזעים". מה שגרייבס כתב לך בתשובה הוא שאם ניקח צבע-עור כדוגמה קלאסית של פנוטיפ שמפריד אוכלוסיות אדם כתוצאה מברירה טבעית, מסתבר שהאתרים הגנטים שמכתיבים אותו מתחלקים עם FST גבוה משמעותית מהממוצע. רוב האתרים האחרים, כולל אתרים שקשורים לתכונות קוגניטיביות, הם בעלי FST נמוך בהרבה. זה רומז שיכולת קוגניטיבית לא מתנהגת כמו צבע עור, והיא לא נבררה באופן שונה באוכלוסיות אדם שונות.

ההסתייגות שלי מהנושא הוא שבעשר/חמש עשרה השנים האחרונות נעשה מאוד ברור שהשונות בתוך אוכלוסיות אדם הולכת וקטנה באופן מאוד סדיר כתלות במרחק הגאוגרפי מאפריקה. בנוסף נעשה מאוד ברור שכאשר לוקחים אוכלוסיות שלכל אחת מהן שונות אחרת (הפרת אחת ההנחות המקוריות של רייט) FST בינהן מוכתב למעשה רק ע"י ההבדל בשונות. כתוצאה מזה, FST של אוכלוסיות אנושיות גדל באופן סדיר עם המרחק הגאוגרפי באפריקה, ולמעשה נמצא בקורלציה מדהימה עם השונות בתוך האוכלוסיה.

מה שזה אומר בפועל הוא שההבדל הגנטי העיקרי בין אוכלוסיות אדם הוא איבוד שונות כתוצאה מאפקט מייסד סדרתי. באופן מאוד פשטני - דמיין לעצמך אוכלוסיה A של 10,000 אפריקנים, בחר באופן אקראי לחלוטין 10 מתוכם, קרא להם אוכלוסיה B ומדוד את FST בין A ל-B. השונות בתוך B קטנה משמעותית (הרבה אללים ב-A לא זכו להיבחר בתוך B) ולכן תקבל FST גדול. לא צריך הפרדה גאוגרפית, לא צריך מוטציות חדשות, לא צריך שמוטציות תעבורנה פיקסציה, לא צריך לחכות דורות, לא צריך ברירה טבעית או מינית או מלאכותית. עצם זה שדגמת תת-קבוצה קטנה בהרבה כבר יצר FST משמעותי.

כמובן אנחנו מדמיינים שאוכלוסיה B נדדה נאמר מעבר למיצרי באב-אל-מנדב והתיישבה בערב הסעודית, שם תוך לא הרבה דורות היא יכולה להגיע לגודל אוכלוסיה דומה לשל A, אבל השונות בתוכה עדיין קטנה משמעותית (האללים שאבדו לא חוזרים). בשלב זה מתוך אוכלוסיה B נבחר תת-אוכלוסיה C אשר תהגר נאמר להודו, וחוזר חלילה עד שכל היבשות מאוכלסות, ונוצר גראדיינט של ירידה בשונות ועלייה ב-FST עם המרחק מאפריקה. זה כמובן יהיה מאוד מטעה להשוות FST שנוצר באופן כזה עם FST שנוצר באופן שרייט חשב עליו, היינו אוכלוסיות בגודל ושונות דומים, שמתפתחות הרבה זמן באזורים ובתנאים אחרים, וכתוצאה מתבדלות בהדרגה זו מזו.
 

Charles Darwin

New member
ההבחנה המלאכותית הזו לא קיימת.

אין הבחנה בין עליה "אמיתית" ב-Fst כתוצאה משונות חדשה לבין עליה "מזויפת" ב-Fst כתוצאה מירידה בשונות. כל עליה נחשבת. ההבדל בין כלבים הוא לא זניח ולא יותר קטן מאשר בין תתי-מין של שימפנזה. להיפך - הוא גדול אולי פי 100. אם אתה טוען שהוא לא קיים (כלומר קטן פי 100?) אז להערכתי מדובר בפספוס של כמיליון אחוז.

"כדאי מאוד להבין ניתוח שונות ANOVA (לא רק בשביל FST אגב, זה כיום אחת השיטות הסטטיסטיות החשובות ביותר במדע)."

גם ל-ANOVA (או AMOVA כפי שזה מוגדר במקרה של התמיינות מולקולרית) יש בעיות (לדעתי יותר משמעותיות מאשר ל-Fst). זה לא אומר שצריך לשלול את המדדים, אלא שרצוי להבין אותם ואת מגבלותיהם.

"מה שויקיפדיה קצת מפספסת זה שהתאוריה של FST עושה לא מעט הנחות (גלויות וסמויות)."

כמו ה"תאוריה" של הגרם או המטר או הליטר? צריך להבדיל בין המדד עצמו לבין המסקנות של אנשים לגביו.

"רייט עצמו כבר מראה בספר מ-1978 דוגמה מספרית של שתי אוכלוסיות שהן נפרדות לחלוטין וצריכות בתאוריה לקבל FST של 1, אבל באופן מעשי מקבלות רק שליש. בין אם זה נכון ובין אם לא"

זה נכון. למשל בלוקוס עם אללים מרובים (כמו מיקרוסטליטים) ה-Fst כנראה לא יתקרב ל-1 גם אם אין שום חפיפה בין האללים.

"זה רומז שיכולת קוגניטיבית לא מתנהגת כמו צבע עור"

אף אחד רציני לא טוען שיכולת קוגניטיבית מתנהגת כמו צבע עור. אם נסתכל על ה-Fst הגנוטיפי והפנוטיפי בצבע עור וביכולת קוגניטיבית, יש לנו מידע סביר על שלושה מתוך הארבעה (בהערכה גסה לפי מה שידוע לי נגיד בערך 0.9 לפנוטיפי בצבע עור, 0.5 לגנוטיפי בצבע עור, ו-0.3 לפנוטיפי ביכולת קוגניטיבית) וחסר לנו רק ה-Fst הגנוטיפי הקוגניטיבי. בהינתן מכלול הנתונים, גם אם רוב ההבדלים הקוגניטיביים בין הגזעים הם מולדים, ה-Fst הצפוי יכול בקלות להיות קרוב ל-0.15.

רק כדי לסבר את האוזן, נראה שרוב ההבדל הפנוטיפי בין גברים לנשים הוא בגלל גן אחד - ה-SRY. אם מחשיבים כל גן כאתר (לוקוס) בגנום, ה-Fst הגנוטיפי הכללי בין גברים לנשים הוא בערך 0.00004, שזה פי כמה אלפים פחות מאשר בין הגזעים. אני מניח שאפשר לצמצם את ההבדל למוטציות בודדות ואולי למוטציה בודדת, מה שיקטין את ה-Fst הזוויגי לכדי מיליונית מאשר ההבדל בין הגזעים. בכל מקרה נראה שההבדלים הפנוטיפיים בין גברים לנשים גדולים בכמה סדרי גודל מאשר ההבדל הגנטי, מה ששוב מראה שהבדלים גנוטיפיים הם מדד בעייתי להבדלים פנוטיפיים.

"והיא לא נבררה באופן שונה באוכלוסיות אדם שונות."

רק אם נסתכל על אבולוציה בצורה שטחית להחריד, כאילו שכל הבדל שפחות מאשר הפרדה מלאה לא נחשב בכלל הבדל.

"ההסתייגות שלי מהנושא הוא שבעשר/חמש עשרה השנים האחרונות נעשה מאוד ברור שהשונות בתוך אוכלוסיות אדם הולכת וקטנה באופן מאוד סדיר כתלות במרחק הגאוגרפי מאפריקה."

השונות בין זני כלבים הולכת וגדלה ככל שצוואר הבקבוק היה גדול יותר - האם אתה מסתייג גם מההבדלים בין גזעי כלבים? אם לא, כנראה שההסתייגות שלך מגיעה ממקום אחר.

"בנוסף נעשה מאוד ברור שכאשר לוקחים אוכלוסיות שלכל אחת מהן שונות אחרת (הפרת אחת ההנחות המקוריות של רייט) FST בינהן מוכתב למעשה רק ע"י ההבדל בשונות."

זו אכן הסתייגות נוספת, אלא שבפועל גם היא פועלת כדי למזער את ההבדלים בין הגזעים.

"מה שזה אומר בפועל הוא שההבדל הגנטי העיקרי בין אוכלוסיות אדם הוא איבוד שונות כתוצאה מאפקט מייסד סדרתי."

שזה גם ההבדל העיקרי בין גזעי הכלבים.

"באופן מאוד פשטני - דמיין לעצמך אוכלוסיה A של 10,000 אפריקנים, בחר באופן אקראי לחלוטין 10 מתוכם, קרא להם אוכלוסיה B ומדוד את FST בין A ל-B. השונות בתוך B קטנה משמעותית (הרבה אללים ב-A לא זכו להיבחר בתוך B) ולכן תקבל FST גדול."

ה-Fst בין אוכלוסיית אב של כמיליון לבין אוכלוסיית בת של כאלף צפוי להיות בערך אפס אלא אם כן אוכלוסיית האב היתה מפולגת גנטית עוד לפני הפיצול. עקרונית יכול להיות שה-Fst בין אלה שיצאו מאפריקה לבין אלה שנשארו מאחור (לא כולל אוכלוסיות חריגות כמו בושמנים, פיגמים וכו') היה קרוב לאפס, וה-Fst עלה בשלב מאוחר יותר כתוצאה מצווארי בקבוק, סלקציה וכו'.

"לא צריך הפרדה גאוגרפית, לא צריך מוטציות חדשות, לא צריך שמוטציות תעבורנה פיקסציה, לא צריך לחכות דורות, לא צריך ברירה טבעית או מינית או מלאכותית."

למעט ברירה מלאכותית, לא צריך אף אחד מהנ"ל גם בשביל גזעי כלבים.
 

Charles Darwin

New member
ו-"השונות בתוך B קטנה משמעותית" זה לא נכון.

"באופן מאוד פשטני - דמיין לעצמך אוכלוסיה A של 10,000 אפריקנים, בחר באופן אקראי לחלוטין 10 מתוכם, קרא להם אוכלוסיה B ומדוד את FST בין A ל-B. השונות בתוך B קטנה משמעותית"

אז זהו שלא. בפועל השונות בתוך B צפויה להיות פחות או יותר זהה לשונות בתוך A. ההסבר לכך מאוד פשוט: מדדים של שונות ו-Fst מחושבים בין זוגות של רצפים (מה שנקרא pairwise), כך שהתוצאה לא תלויה בגודל המדגם. לכן מתנגדי הגזעים אוהבים להגיד שהשונות בין שני שימפנזים היא יותר גדולה מאשר בכל האנושות - כי זה לא משנה אם זה שניים או מיליון, אבל שניים נשמע יותר דרמטי ויוצר אשליה שהאדם הוא מין הומוגני באופן קיצוני. אם אתה באמת רוצה לרדת לעומק העניין, אני מציע לך לברר את הסוגיה הזו ברצינות - ואם יתברר שאני צודק, נסה לחשוב איך קורה שאפילו אתה (שבכל זאת מתמצא בתחום יותר מאשר רוב הביולוגים) נפלת בפח ומה זה אומר לגבי הצורה המטעה שבה הדברים מוצגים. שוב, אין לי שום ציפיות שתעזוב את ה-dark side, אבל אי אפשר להגיד שאני לא מנסה.
 
אתה יכול להסביר למה אין תלות בגודל המדגם?

"מדדים של שונות ו-Fst מחושבים בין זוגות של רצפים (מה שנקרא pairwise), כך שהתוצאה לא תלויה בגודל המדגם"
למה בין זוגות של רצפים זה לא תלוי ואיך חישוב אחר היה יכול להיות תלוי?

לפחות המאמר הבא מסכים איתך לגבי היעילות של FST:
http://www.nature.com/scitable/topicpage/using-snp-data-to-examine-human-phenotypic-706

FST has proven to be a very useful parameter in many respects, especially in its ability to describe the degree of population substructure. One major advantage of FST is the possibility that it may tell us a lot about the processes leading to divergence between subpopulations and/or the maintenance of that divergence. This is because when two subpopulations begin to diverge, genetic differentiation between the two subpopulations begins. In humans, this divergence started with the exodus from Africa approximately 50,000 to 75,000 years ago. Mutations acquired by individuals were then subject to pressures of natural selection and were therefore either maintained or lost.
 

Charles Darwin

New member
שאלה טובה. ההסבר הקצר הוא שככה מודדים.

וכפי שאמרתי בעבר (לא שמישהו כאן קיבל את זה), אתה אפילו לא צריך שני פרטים - מספיק פרט דיפלואידי בודד. קח פרט אחד של שימפנזה; פרט אחד של אדם; פרט אחד של כל יונק - ותוכל להעריך כמה שונות יש באוכלוסיה שלו.

כמובן שיש הבדל בין אוכלוסיה של 10 ל-10,000, אבל זה לא בא לידי ביטוי במדידת שונות מיד אחרי הפיצול, אלא בהמשך, כתוצאה מצוואר הבקבוק. בגלל ש-10 זה מספר ממש קטן, השפעת צוואר הבקבוק תהיה כנראה דרמטית, אבל אם מדובר על הגירה של כמה מאות פרטים מתוך אוכלוסיה של עשרות אלפים, שמלווה בגידול אקספוננציאלי (ע"ע היציאה מאפריקה), יתכן שצוואר הבקבוק לא יהיה מאוד דרמטי. חשוב לזכור שרוב הפולימורפיזמים בתוך האוכלוסיה הם נפוצים, ולכן במדגם של כמה מאות (לא 10) נצפה למצוא את הרוב המוחץ של המגוון הגנטי. מה שנפספס זה את כל המוטציות החריגות, אולם אלו ממילא לא תורמות ל-Fst, הן משום שהן נדירות מאוד בחישוב הכללי (גם כולן ביחד) והן משום שהן מעלות את השונות לא רק בין האוכלוסיות אלא גם בתוכן.
 
כלומר גם במדידה אמפירית?

רואים ש FST לא ממש תלוי בגודל האוכלוסיה או תת-האוכלוסיה הנמדדת משום שבממוצע כל הפרטים דומים?

להבנתי ה 15% הבדל שמודדים אצל בני-אדם אומר ש 85% מההבדל הנמדד הוא בין פרטים מכלל האוכלוסיה ו 15% בין האוכלוסיות עצמן. האם זה מסתדר עם הנחת ה "אין תלות בגודל"?

אגב - נראה שלפחות בפרויקט HapMap אכן דוגמים מעט פרטים:
Haplotypes are generally shared between populations, but their frequency can differ widely. Four populations were selected for inclusion in the HapMap: 30 adult-and-both-parents trios from Ibadan, Nigeria (YRI), 30 trios of U.S. residents of northern and western European ancestry (CEU), 44 unrelated individuals from Tokyo, Japan (JPT) and 45 unrelated Han Chinese individuals from Beijing, China (CHB). Although the haplotypes revealed from these populations should be useful for studying many other populations, parallel studies are currently examining the usefulness of including additional populations in the project.

http://en.wikipedia.org/wiki/International_HapMap_Project#Samples_used
 

Charles Darwin

New member
יש כאן הטעיה מכוונת במטרה להמעיט בערך הגזעים

בכל מקרה את ה-85/15 אתה תקבל בכל גודל מדגם.
 
מה ההטעיה?

אגב נראה שהטענה שלך לגבי גודל אוכלוסיה נכונה אבל זה יותר מורכב מתמטית.

http://www.cmpg.unibe.ch/pdf/pdf_journal_club_ss08/08-barreiro_et_al-natgen.pdf

In the above formula, ni denotes the sample size in the ith subpopulation and nc denotes the average sample size across the S samples, also incorporating and correcting for variation in sample size between subpopulations

מסתבר שלא מדובר בחוקרים "דמיקולו"
 
אתה הוא זה שבעבר ניסית לשכנע אותנו

בפורום הזה, בנחרצות האופיינית לך, שאפילו בתוך שימפנזה יחידה יש יותר שונות מאשר בכל האוכלוסיה האנושית. זה נבע מאי הבנתך את המונח "הטרוזיגוטיות" ואיך מחשבים nucleotide diversity. כזכור לי אני הוא זה שהסברתי לך את עניין הממוצע על פני זוגות.

לעומת זאת, בדיונים אחרים חלקת על תוצאות שלא אהבת בגלל גודל מדגם שנראה לך קטן מדי...

האמת, שאותה ניסיתי להסביר לך כמה פעמים, היא שהשונות בהחלט מושפעת מגודל המדגם, אבל לא באופן לינארי. מדגם קטן מאוד של פרטים בהכרח יפספס חלק ניכר מן השונות של האוכלוסיה. בשביל לראות את זה מספיק לחשוב על הסיכוי לפספס את האלל לעיניים כחולות או האלל לשער ג'ינג'י כאשר דוגמים באקראי 5 ישראלים. כאשר מגדילים קצת את המדגם כבר מצליחים לדגום את רוב השונות באוכלוסיה, אבל עדיין מפספסים חלק ניכר מן האללים הנדירים יחסית כמו האלל לטאי-זקס.

זה די קונצנזוס (דומני שאפילו ג'ון גודרם אישר) שהירידה הסדירה בשונות הגנטית של אוכלוסיות אנושיות עם ההתרחקות מאפריקה נובעת מאפקט מייסד.
 

Charles Darwin

New member
ואני עדיין אומר שיש יותר שונות בשימפנזה יחידה

מאשר באנושות כולה. זה נובע מההגדרה של שונות גנטית ומאופן החישוב. אם היינו מתחשבים באללים נדירים, היינו מקבלים שונות יותר גבוהה בסין מאשר בהאדזה. בכל מקרה ההשפעה של מוטציות נדירות ופרטיות נעשית זניחה אחרי שאתה דוגם כמה עשרות אנשים, ועל כל מוטציה חדשה כזו אתה תמצא עשרות ומאות מוטציות שכבר יש לך במדגם. סביר להניח שבאוכלוסיה שיצאה מאפריקה היו את כל הפולימורפיזמים הנפוצים והחצי-נפוצים (בסדר גודל של האלל לשיער ג'ינג'י או לטאי-זקס בישראל) ורוב הירידה בשונות נבעה מסחף מאוחר יותר או מערבוב בין אוכלוסיות בתוך אפריקה.

אין לי מושג מתי התלוננתי על גודל מדגם קטן, אבל אני לא רואה איך זה רלוונטי. זה שגודל המדגם לא משנה לחישוב השונות לא אומר שזה אף פעם לא משנה. בכל מקרה פחות איכפת לי למי מאיתנו יש זיכרון יותר סלקטיבי ויותר איכפת לי שתתייחס לשתי הנקודות שהעליתי:

1. גם בכלבים רוב העליה ב-Fst והירידה בשונות הן כתוצאה מצוואר בקבוק ובכל זאת השונות הפנוטיפית ביניהם שמה בכיס הקטן את שאר המינים.
2. אני טוען שהסיבה שה-Fst עלה רק בקצת כשלונג וקיטלס הוסיפו את השימפנזים היא שהמדגם של השימפנזים היה קטן (פחות מ-10% מהמדגם של האדם). האם אתה מסכים? האם יש לך הסבר אחר?
 
אני לא תמיד קולט את ההומור שלך

בתוך אותה הודעה לא ארוכה אתה גם מתעקש עוד פעם שיש יותר שונות בשימפנזה יחידה (עמדה שהודעה אחת קודם ייחסת למתנגדי הגזע), גם לא זוכר מתי התלוננת על גודל מדגם קטן, וגם מתלונן על גודל המדגם הקטן של לונג וקיטלס... אתה מנסה לכתוב פארודיה של עצמך?

במאמר הזה חישבו שקבוצת מייסדים היפותטית של 5 אנשים יכולה במכה אחת להוריד את ההטרוזיגוטיות הממוצעת מ-0.91 (כמו שיש באפריקה היום) ל-0.82 (כמו שיש באירופה ובמזרח התיכון). כמובן שלא הם ולא אני מאמינים שכל אירופה והמזרח התיכון יושבו במכה אחת ע"י 5 מייסדים, אבל זה נותן לך סדר גודל. הבדלי השונות בין אוכלוסיות סמוכות בעולם קטנים בהרבה מן ההבדל בין 0.91 ל-0.82, כך שאין שום בעיה לקבל אותן באמצעות אפקט מייסד עם אוכלוסיות מייסדים גדולות יותר. אם יש לך תסריט אלטרנטיבי, אתה מוזמן להסביר איך הוא הצליח לגרום לירידה הדרגתית סדירה של השונות עם המרחק מאפריקה, על פני כל יבשות כדור הארץ פלוס איי האוקיינוס השקט. אני לא מכיר אפילו מאמר מדעי אחד שהציג תסריט כזה.

1. השונות הפנוטיפית של גזעי כלבים היא תוצאה של ברירה מלאכותית חזקה מאוד (אני מקווה שעל הקונצנזוס הזה לפחות אתה לא חולק). לא היה אצל כלבים "צוואר בקבוק" במובן הרגיל של המונח. היו הרבה הכלאות קרובים לטובת הברירה המלאכותית, ולאותה מטרה גם הכליאו מדי פעם דווקא עם בני גזעים מרוחקים.

2. לונג וקיטלס מדגימים באופן משכנע למה הוספת השימפנזים גרמה לעלייה קטנה ב-FST. הסיבה העיקרית היא שמדד FST פותח על בסיס ההנחה שלכל האוכלוסיות אותה חלוקה היררכית, ולכן הוא מייצר ארטיפקטים כאשר מכניסים לו אוכלוסיות עם חלוקה היררכית שונה. כאשר לונג וקיטלס ויתרו על ההנחה הזו, הFST בין בני האדם והשימפנזים באותו המדגם בדיוק קפץ מ-0.18 ל-0.36.
 
הייתי מעריך שכן

ה-FST שהם משתמשים בו הוא הסטנדרטי ביותר, למרות שגם הוא כנראה פיתוח מסויים unbiased של הגרסה המקורית של רייט, אבל לא אחד המדדים המתוקנים.

הם בעצמם מודים שהשיטה שלהם לפעמים מוציאה ערכי FST שליליים. הם טוענים שזה מייצג טעות דגימה, כלומר לא בעייה של שיטת החישוב עצמה. לא מובן לי איך זה יתכן, אבל אני לא מתמצא בנושא.

אם הם מפעילים את כל החישובים שלהם על אתרים גנטיים שונים מאותו מדגם של נבדקים, סביר שהם מצליחים לתקן טעויות שיטתיות. אם נגיד FST מכניס טעות ב-50% כלפי מטה בכל האתרים, אז השוואה בין האתרים עדיין נכונה, ורק השוואה לתוצאות ממחקרים אחרים היא בעייתית. אבל המאמר האחרון ששמתי לך למטה מראה ש-FST רגיש לשכיחויות של האללים. בכל אתר גנטי יש שכיחויות אחרות, לכן אני מעריך שעל זה גם שימוש באותו המדגם לא יפצה.

המאמר שהבאת הוא חלק מאופנה של מחקרים מן העשור האחרון, אשר מאתרים בשיטות שונות עקבות של ברירה טבעית בגנום. אלו מחקרים שנוטים להוציא הרבה false positives. למשל המחקרים של ברוס לאהן, למרות שהם השתמשו בשיטה אחרת ולא ב- FST. אישית, אני מאמין לתוצאות של מחקרים כאלו רק כאשר הם משוכפלים במדגם נוסף בלתי תלוי (אני גם משתדל לעבוד ככה במחקר שלי. כאשר הסטטיסטיקה בעייתית אני בודק עוד פעם במדגם בלתי-תלוי). לא עברתי על המאמר הנוכחי באופן יסודי, אבל לא ראיתי שהם משכפלים את התוצאות, ולכן אני הייתי מתייחס אליהן בזהירות.
 
למעלה