מדע 2.0 – האם האינטרנט יביא למהפיכה במדע?

התפתחויות טכנולוגיות מאז ומעולם השפיעו על הצורה שבה הידע המדעי מועבר ונצבר. עד לפני 100 שנה היו עוברים לפעמים חודשים ושנים עד שמחקרים של חוקרים היו מגיעים לידיעת עמיתיהם. כבר בשנות ה-70 של המאה ה-20 נפוץ היה השימוש בדואר אלקטרוני בין החוקרים, ועם התפתחות האינטרנט לחוקרים יש גישה מיידית כמעט לכל מאמר מדעי שמתפרסם.

הפצת הידע האקדמי היא רק פן אחד שבה האינטרנט יכול להשפיע על המחקר המדעי. האינטרנט יכול להשפיע גם על הצורה שבה הידע הזה מתפתח. בשנים האחרונות אנחנו שומעים שוב ושוב על משהו שהוא 2.0. זה מושג שבא לסמל מהפיכה בתחום מסוים, לרוב בהקשר של מחשבים או תיקשורת. הדוגמא הנפוצה ביותר היא Web 2.0 שבאה להצביע על כך שהיום יש דור חדש של תוכנות או מוצרים הקשורים לאינטרנט ששונים באופן מהותי מאלו שהיו בעבר.

לאחרונה עולה מושג חדש, Science 2.0 שמתמקד בצורה שבה האינטרנט יכול להועיל למחקר המדעי בפרט, ולתהליך המדעי בכלל. כתבתי בעבר על איך נעשית הערכת חוקרים באקדמיה, וגם הזכרתי את השמרנות הרבה שיש פעמים רבות במדע, בעיקר בכל הקשור לפסיכולוגיה. כעת, האינטרנט יכול להציע לנו גם אלטרנטיבה לצורה שבה השיפוט המדעי עצמו מתבצע.

הרעיון הבסיסי שעומד מאחורי מדע 2.0 הוא לנסות לקצר תהליכים ולהביא למחקרים טובים יותר על ידי ביקורות מיידיות. כל מי שעוסק במחקר אקדמי יודע שלרוב לוקח זמן רב למדי בין ביצוע מחקר בפועל ועד שהוא מתפרסם בכתב עת כלשהוא. כל מחקר מדעי כולל בתוכו ברוב המקרים איסוף נתונים, קידודם למחשב, עיבודים סטטיסטיים, כתיבת מאמר, שליחתו לכתב עת מסוים, שיפוט עמיתים, תיקונים של המאמר ורק לבסוף מגיע הפירסום שלו. זה כמובן תיאור כללי למדי ולכל מחקר יש את הדרך שהוא עושה עד לפירסום המיוחל. האינטרנט כבר היום מאפשר לנו לקצר תהליכים מסוימים בשרשרת הארוכה הזו. כך למשל, ישנם מחקרים רבים המבוצעים דרך המחשב, מה שמקצר את זמן איסוף הנתונים ובעיקר עוזר לקידוד הנתונים (המחקרים הללו כמובן לא תמיד אפשריים ולא נטולי בעיות כשלעצמם). דרך נוספת שבה נוקטים יותר ויותר כתבי עת היום, היא פירסום מאמרים אונליין עוד לפני ההדפסה שלהם בכתב העת. מספר כתבי עת כבר עברו לשלב הבא שבו הם ויתרו כליל על הדפסת כתב העת וכל המאמרים מופיעים בצורה מקוונת בלבד.

מדע 2.0 לוקח את הנושא צעד אחד קדימה. הרעיון של מדע 2.0 הוא שחוקרים יפרסמו את הנתונים הגולמיים של המחקרים שלהם אונליין, ויאפשרו לכל אחד להסתכל עליהם, להעיר הערות,  ולנסות לעבד אותם סטטיסטית על פי הבנתם. במצב היום, רק חלק קטן מהנתונים והניתוחים הסטטיסטיים בכל מחקר מוצאים את דרכם למאמר הסופי. לרוב חוקרים אוספים הרבה מאוד נתונים שלא תמיד הם עושים בהם שימוש, או שלא הניבו תוצאות כלשהן ולכן אין צורך לדווח עליהם.

היתרונות של גישה כזו היא בשקיפות הרבה יותר גדולה של התהליך המדעי. אם אנשים יראו את כל הנתונים ולא רק את אלו שהחוקר המקורי בחר להציג, אפשר יהיה לקבל תמונה שלמה יותר של המחקר. אחת הבעיות המרכזיות של המדע המודרני היא שמאמרים בכתבי עת מייצגים רק חלק קטן ממה שהחוקר עשה או חשב עליו. למשל, ידועה ההטייה של כתבי עת לפרסם תוצאות חיוביות בלבד (ניסוי שהצליח, אפקט קיים וכו'). ההטייה, הידועה בשם Publication Bias, יכולה לגרום לך שאפקט מסוים התקבל במקרה במחקר אחד למרות שהוא לא קיים במציאות, אבל מכיוון שהוא היחיד שהתפרסם (בגלל שכל מי שלא מצא את האפקט במחקרים אחרים לא הצליח לפרסם אותו) מתקבלת תמונה לא נכונה של התופעה (על מנת להילחם בנושא, החל להתפרסם לאחרונה כתב עת מקוון שהוקם על ידי מדעני חברה בארה"ב ואירופה, שכל מטרתו לפרסם מחקרים עם תוצאות שליליות שלא מתקבלות לפירסום בכתבי העת הרגילים).

מעבר לכך, כשמדובר בנתונים כמותיים השמיים הם הגבול מבחינת כמות המודלים הסטטיסטיים שניתן להחיל עליהם. לחוקרים אין תמיד ידע סטטיסטי נרחב, ויתכן שאם יחשפו את הנתונים הגולמיים שלהם בפני אחרים, ניתן יהיה להגיע לממצאים שהחוקר המקורי לא חשב עליהם.

מצד שני, יש כמה וכמה בעיות שעולות מהאפשרות לפרסם נתונים גולמיים ברשת. ראשית, יש את הבעייה הפסיכולוגית הבסיסית והיא שאנשים לא אוהבים להיות חשופים לביקורת אינסופית. כל מי שעוסק במחקר יודע עד כמה קל לבקר מחקרים של אחרים ועד כמה אפשר לקחת ללב ביקורת (גם אם היא לגיטימית ולא מתוך כוונה רעה) על עבודה שהשקעתם בה את מיטב זמנכם ומרצכם. זה נכון לגבי מאמר שכתבתם, ויכול להיות עוד יותר נכון לגבי חשיפת נתונים ברמה הכי בסיסית שלהם. אם המחקר מתפרסם ברשת, הביקורות יכולות להיות אכזריות ולא ענייניות במיוחד מטעם בעלי אינטרסים שונים, הדיוטות או סתם שונאים.

שנית, וזו אולי הבעייה המרכזית, ישנה תמיד אפשרות שמישהו יגנוב את הנתונים וינכס אותם לעצמו. השיטה המדעית עובדת כך שאם לא פירסמת אתה לא קיים. חוקרים יכולים לחשוש שאחרים ימהרו להשתמש בנתונים הללו ויפרסמו אותם לפני שניתנה להם עצמם האפשרות לפרסמם, ואחרי זה יהיה קשה מאוד להוכיח שאלו הנתונים שלך. גם ככה האקדמיה רוויה בתחרותיות רבה ובמאבקים אישיים, ושאלות על בעלות הנתונים הם הדבר האחרון שחוקרים מעוניינים להיכנס אליהם. אגב, זה לא רק עניין של הכרה מדעית גרידא, אלא במקרים רבים יכול להוביל אנשים לרשום פטנטים על מחקרים של אחרים (בעיקר בתחומים טכנולוגיים או ביו-רפואיים). חוקי הפטנטים הקיימים היום לא מכירים בפירסום אינטרנטי כהוכחה לבעלות. מעבר לכך, נניח שפירסום נתונים גולמיים הוביל חוקר אחר למסקנות שונות, או שהוא השתמש בניתוחים סטטיסטיים שונים וטובים יותר מהחוקר המקורי. איך בדיוק יתחלק הקרדיט על המחקר? האם חוקרים שונים יהיו רשאים לפרסם מאמרים שונים על אותם נתונים? מאבקים כאלו התקיימו מאז ומעולם בין חוקרים ויש סבירות גבוהה שרק יחריפו עם יישום מדע 2.0.

צעד מרחיק לכת יותר הוא לגרום לכך שהמאמרים עצמם יהיו פתוחים לביקורת עוד בשלב הטיוטה. כיום, חוקרים עומלים על מספר טיוטות לפני פירסום המאמר. מה אם כל מאמר יהיה פתוח לביקורת של מומחים ולא מומחים ברשת? מצד אחד, יתכן שאפשר יהיה לשפר אותו בצורה ניכרת לפני שליחתו לפירסום ולהגביר את שיתוף הפעולה מצד חוקרים אחרים (אחת הבעיות באקדמיה היא הימצאותם של חוקרים שעוסקים בדיוק באותו נושא בלי שידעו אחד על קיומו של השני). מצד שני, יהיו תמיד מבקרים שאינם מומחים בתחום שהביקורות שלהם יהיו לא ענייניות ורק יכבידו ויעכבו את הפירסום. ניסיון מעניין בנושא נעשה במאמר הבא שעוסק בנושא של מדע 2.0. המאמר, מבית היוצר של סיינטיפיק אמריקן, פורסם לראשונה ברשת, והיה חשוף להערות הקוראים לפני שהובא לדפוס. גירסה עוד יותר קיצונית של כל הנושא הזה יכולה לאפשר לאנשים לערוך את המאמרים עצמם כפי שנעשה בויקי. הבעייה פה היא שעריכה מגמתית או עריכה מטעמם של מומחים מטעם עצמם שרק יזיקו למאמר.

אם כבר אנחנו מפרסמים טיוטות של מאמרים אז למה לעצור שם? למה שלא נפרסם את הפרוטוקולים המלאים של כל ניסוי, ההצלחות, כמו גם הכישלונות שלו? זה יכול להיות מעניין אבל גם מאוד מעייף. כבר היום, למרות התמציתיות של מאמרים מדעיים, רבים מהם ארוכים מדי ומלאים בתוכן רב. שוו בנפשכם איך יראה אתר שיתאר ניסוי שלם על בוריו? הרשת תופץ בכמות אדירה של מידע שלא בטוח שכולו רלוונטי, ואנשים יתקשו לברור מה חשוב ומה לא, וכך מידע שבאמת חשוב ילך לאיבוד.

למרות כל החסרונות הללו לא נראה שיהיה משהו שימנע את ההתפתחות של מדע 2.0 ברשת. הדוגמא הטובה לכך היא פרוייקט בסגנון ויקי (אפליקציית Web 2.0 קלאסית), שהתחילו שני סטודנטים במחלקה לביולוגיה הנדסית באוניברסיטת MIT ושמטרתו לקדם את הידע המדעי בתחום. ההרגשה שלי שפרוייקטים כאלו רק יתגברו בעתיד הקרוב, אבל בסופו של דבר לא יהיו חופשיים לחלוטין לביקורת. יתפתחו מנגנונים להגן על הממצאים המקוריים של החוקרים, כמו גם דרכים שישפרו את מנגנון הביקורת. אחת החסרונות הגדולים הוא ביקורות אנונימיות לגמרי שגורמות אי נוחות רבה להרבה אנשים. אולי תוקם רשת פנימית שבה רק לסטודנטים או פרופסורים בעלי הרשאה תינתן גישה חופשית כך שאפשר יהיה לסנן תגובות שרוב הסיכויים לא תורמות הרבה (למרות שתמיד יש סיכוי שהדיוט גמור יתרום תרומה משמעותית הרשת מלאה בטרחנים כפייתיים). אתרים בסיגנון ויקי גם מגינים בצורה טובה למדי על הקרדיט של החוקרים בזה שכל שינוי מתועד ונשמרת כל גירסא של כל מאמר. היא גם מאפשרת פירסום מהיר יותר של רעיון, לפני שלמישהו אחר תהיה אפשרות לטעון שהוא שלו (כאמור, בעייתי בהקשר של פטנטים).

מאוד יתכן שזה רק עניין של מאסה קריטית. ברגע שיהיו מספיק אנשים שיפרסמו אונליין נתונים גולמיים או מחקרים בשלבי פיתוח הגישה הקיימת היום תיראה מיושנת ולא רלוונטית. הבעייה הגדולה היא שלא תמיד טובת המדע עומדת בפני החוקרים אלא ענייני אגו, ואת אלו, מדע 2.0 רק מחריף.

Both comments and trackbacks are currently closed.

תגובות

  • תימורה  On 28/04/2008 at 8:50 am

    מצד אחד, האפשרויות העצומות הנפתחות מעצם הגישה החופשית למידע הזה, שכוללות שיתוף פעולה בין מדענים מכל העולם ואפשרויות לסיעור מוחות ולהפריה הדדית.

    אבל מצד שני, הרי הכל רחוק מלהיות טהור. איך באמת מתמודדים עם סכנות הגניבה (של המידע, של הקרדיט) ושל שימוש לרעה?

    ועוד שאלה: האם לא נכון לתהליכים שבמהותם הם "עובריים" (וזה כולל גם יצירה) להיות סמוים מהעין החיצונית עד שיצאו לעולם כשהם בשלים? האם כל כך הרבה עיניים שמתבוננות בהם לא יכולות להזיק להם, כשהם עדיין מתפתחים?

  • גיל  On 28/04/2008 at 9:04 am

    שאלה הגניבה היא אכן שאלה קריטית, אבל סביר שימצא לה פיתרון טכנולוגי. בויקיפדיה למשל אפשר לראות מי כתב מה ומתי. אפשר גם ליצור רשת סגורה שרק אנשים מורשים ומוכרים יהיו בעלי גישה למידע. בסופו של דבר, אם מישהו רוצה להעתיק הוא ימצא דרך, אבל אפשר להקטין את הסיכונים.

    השאלה השנייה יותר מעניינת ואני יכול להבין מאיפה היא באה. צריך באמת להפריד בין תהליכי יצירה שמשתנים כל הזמן, לנתונים "קשים" שלא חשוב כמה תסתכלי עליהם הם לא ישתנו (נגיד שאלונים שאנשים מילאו). מה שכן, חוקרים בהחלט יושבים על המדוכה ומנסים להבין את מה שמונח לפניהם. פירסום מוקדם יכול להוביל למעין "מירוץ חימוש" שבו תידרשי לעבוד הרבה יותר מהר, לפני שמישהו אחר זריז יותר, יעבד את הנתונים. זה בהחלט יכול להוביל לתחרות לא בריאה. במידה מסוימת זה קיים כבר היום. אנשים בוחרים לשתף אחרים במידע שיש להם אבל זה נעשה מתוך הכרה ברורה שלך יש בעלות על הנתונים והם שם רק כדי לעזור.

    מצד שני, למרות שזה לא בדיוק אותו דבר, יש מיזמים כמו פרוייקט SETI שבו מדענים רוצים שיהיו כמה שיותר אנשים שיעזרו בעיבוד הנתונים.

  • יובל  On 28/04/2008 at 9:26 am

    כדאי לציין בהקשר זה את אתר התדפיסים
    http://arxiv.org/
    הקיים, בצורה זו או אחרת, החל מ-1991. האתר מכיל מאמרים הרבה לפני פרסומם בכנס או כתב-עת.
    עוד מפעל דומה הוא קהילת הקוד הפתוח, בה תוכנה נכתבת כמאמץ קולקטיבי של קבוצת אנשים.
    לדוגמה:
    http://www.answers.com/topic/open-source

  • אבי  On 28/04/2008 at 12:05 pm

    אם אני מפרסם הכל אונליין, מי ישלם לי על העבודה שלי (ומה בדיוק העבודה שלי: היכן בדיוק היא נפסקת / מתי התוכן כבר אינו שלי?)
    בימינו,
    תוצרת העבודה של המדען אינה ידע כי אם תוכן. כאן מתחילה הבעיה אבל כאן גם מתחיל הפתרון.

  • גיל  On 28/04/2008 at 6:10 pm

    אקדמיים כך שזה לא ממש רלוונטי. זה נכון יותר לגבי פטנטים שונים שאפשר לגנוב. לגבי הקרדיט התייחסתי לזה במאמר וזו אכן בעייה.

    יובל, תודה על הקישורים, לא הכרתי אותם.

  • אורן  On 28/04/2008 at 6:44 pm

    בהמשך למה שיובל הזכיר לגבי קוד פתוח וגם ההקשר האקדמי וניסיון ליעל קצת את הדינמיקה של הקוד הפתוח:
    http://www.sciencefriction.net/blog/2007/11/11/48/
    האתגרים די דומים לאתגרים שתיארת כאן בפוסט – איך לנהל את כל המערכת ולא לטבוע בתוך ההרי דטא/קוד שאף אחד לא יודע לקרוא.

  • שרגא  On 29/04/2008 at 12:11 am

    רבים מהכותבים ממעטים להבין מה באמת קורה במעבדות ועד כמה חוקרים שונים אחד מהשני. התהליך המוצע הנו מערכת אבולוציונית לקידום גנבים זריזים. גם היום יש מומחים ליצירת מאמרים מנתונים של אחרים. במערכת שקופה לחלוטין משלב מחברת המעבדה עד לרישומי מחסן הכימיקלים וכלי הזכוכית והזמנות הציוד הכבד ועד למחשב שבו נכתב הסיכום יהיה יתרון אדיר לפרזיטים ויהיה קשה ליוצרים חרוצים שהם כתבנים גרועים.
    מי יסע לקונגרס ממומן עד קצה הקצה על ידי חברות התרופות? מי שאכל פחמן וזרחן רדיואקטיבים ושקל חולדות מטורללות וניתח חתולים חולים או מי שלקח את הנתונים שלו זרק למחשב הוציא קורולציות ונסע לכנס עם הסטודנטית הדדנית של הראשון?
    אולי כסף לא מקבלים אבל מענקים, נסיעות, יעוץ במאות אלפי $ ומה לא עוד.
    אני צריך להיות כסיל מושלם בכדי להעביר את הנתונים שלי שהוצאתי בדם ליבי לאיזה סטיסטיקאי מבריק שגם יעשה חיים וגם יעשה כסף על חשבון הנתונים שלי.

  • אורי כהן  On 30/04/2008 at 12:31 am

    אני חושב שהכיוון הנכון יותר למה שאתה קראת "מדע 2.0" (שם נורא) הוא ביצירת סיכום של "מצב המחקר" בתחום מסויים.

    נניח ליצור וויקי שמסכמת את כל המשפטים המוכחים בתחום כלשהו של מתמטיקה או מדעי המחשב.
    נניח ליצור מאגר בו יוצג הדיאנאיי האנושי עם קישורים מכל נקודה לכל המחקרים שמייחסים לה תכונות מסויימות.
    נניח מאגר שיאפשר לחוקרי שפות מכל העולם לסכם מה בשפה שלהם לא ניתן להסבר על ידי דקדוק גנרטיבי חומקיאני.

  • ירדן  On 10/05/2008 at 7:54 pm

    דווקא אם מעלים מידע בלי לסנן בין רלוונטי ללא רלוונטי זה נראה לי עדיף בסופו של דבר.
    קודם כל ככה כל המידע יהיה זמין ומה שלא רלוונטי היום יכול להיות רלוונטי אחר כך או אולי לבן אדם אחד לא ולבן אדם אחר כן.
    שנית, אפשר תמיד ליצור מנגנון שיאפשר לגולשים לקבוע מה הכי רלוונטי והחלקים האלו יודגשו. ככל שדבר כלשהו יקבל ציון רלוונטיות גבוהה יותר ככה הוא יהיה בולט יותר.
    יש עוד המון אפשרויות לדברים האלו אבל באפון כללי הרבה בעיות כן אפשר לפתור בעזרת כלים טכניים – לפחות כך שאני רואה את זה.

%d בלוגרים אהבו את זה: