קצב דגימה - טכנופילית

כשמהנדסות אומרות "דגימה" (Sample), הן מתכוונות לפעולה שנעשית על מנת ליצג את המידע האנלוגי ("רציף", Analog) בעולם האמיתי בצורה דיגיטלית ("בדידה", Discrete) באמצעים הממוחשבים העומדים לרשותנו. כאשר אנו דוגמות מידע, זה נותן לנו את האפשרות לשמור ולערוך אותו בכל דרך שנרצה, והוא מתנתק מהמקור שלו והופך לנכס דיגיטלי שלנו לכל דבר. כאשר אנו מצלמות תמונה או וידאו, או מקליטות קול, אנחנו יוצרות דגימה של הנוף או הקול באמצעי הדיגיטלי שלנו. כשמהנדסות אומרות "קצב דגימה" (Sample rate) הן מתכוונות לרזולוציה בה אנו מקליטות את הדגימה. ככל שקצב דגימה הוא מהיר יותר, כל הדוגמא שנקליט תהיה באיכות יותר טובה. בפוסט נבין בצורה אינטואיטיבית מהו קצב דגימה, ואיך ניתן להעזר בו. להרחבה אפשר לעיין כאן.

קצב דגימה ואיבוד מידע

כן הכוונה לאיבוד מידע ב"א" ולא עיבוד מידע, לשם נגיע בהמשך. תמיד תמיד כשדוגמים מידע, מאבדים חלק ממנו. מרמז לכך השימוש במילה "דגימה": כאשר לוקחים דגימת דם או דגימת מים למשל, תמיד הדגימה היא רק חלק קטן מהתמונה הגדולה, שאמור ללמד אותנו עליה. כך גם בדגימת מידע, אנו לוקחות חלק קטן מהמידע, ובעזרת הדגימה הזו מקוות ליצג נאמנה את מקור המידע. ככל שניקח דגימות רבות יותר של המידע, כך נהיה קרובות יותר ליצוג של "הדבר האמיתי", המידע כפי שהוא במציאות. אך תמיד יהיה פער בין המידע שנדגום לבין המציאות, גם בקצב דגימה מהיר שמהווה רזולוציה גבוהה, נאבד חלק מהמקור, פשוט בגלל שמדובר בדגימה ולא בדבר עצמו.

דגימה זמנית (דגימה במהלך הזמן)

כדי להבין מהי דגימה בזמן, אפשר לדמיין מסוע של תפוזים. לצורך הדוגמא נדמיין מסוע מאוד לא יעיל, שיכול להכיל רק תפוז אחד ברוחב שלו. כלומר, אם נציב מצלמה ליד המסוע, נצלם בכל זמן נתון או תפוז אחד, או אפס תפוזים. עכשיו נדמיין שהתפוזים מסודרים כך, שכל שתי שניות עובר תפוז מול המצלמה שלנו. אם נרצה לספור בעזרת המצלמה בלבד את מספר התפוזים, עלינו לצלם תמונות בקצב מהיר יותר מקצב הופעת התפוזים, שהוא כאמור תפוז בכל שתי שניות. למשל, נצלם תמונה כל שניה. כך נהיה בטוחות, שלא נפספס אף תפוז. אם נצלם תמונות בדיוק בקצב הופעת התפוזים, יתכן שניפול בדיוק על הזמנים בהם אין אף תפוז בפריים, כלומר נצלם בין הופעת תפוז אחד לבא בתור. בצורה כזו, אם נסתמך על התמונות בלבד, נגיע למסקנה השגויה שבמסוע עברו אפס תפוזים.

מסוע יעיל יותר מזה המתואר עבור דגימה זמנית

דגימה מרחבית (דגימה של המרחב)

כעת נדמיין שיש לנו ארגזים ענקיים שטוחים של תפוזים, כלומר ישנה שכבה אחת בלבד של תפוזים בכל ארגז. הפעם המצלמה תהיה מוצבת גבוה מעל הארגז, ותצלם את התפוזים מלמעלה. אחר כך נעזר באלגוריתם של עיבוד תמונה על מנת לספור באופן אוטומטי את כמות התפוזים. התנאי לכך שנוכל לספור את התפוזים, הוא שהפיקסלים במצלמה יהיו רבים מספיק על מנת שתהיה הפרדה ברורה בין תפוז לתפוז. אם מספר התפוזים יהיה גדול מאוד, נראה מעין "שטיח" כתום, ולא תתאפשר ספירה של התפוזים. התפרסות התפוזים על פני הפיקסלים של המצלמה, היא כמו פריסה של התפוזים על מרצפות רצפה קטנות. אם מרצפת מסויימת תכיל לדוגמא שני תפוזים, סימן שהדגימה המרחבית שלנו לא רגישה מספיק ולא נצליח לספור את מספר התפוזים במרחב.

קצב דגימה ותנאי נייקוויסט

תנאי נייקוויסט (Nyquist) מספר לנו מהו קצב הדגימה שעלינו לדגום בו, על מנת לא לאבד מידע חשוב בדגימה. התנאי אומר, שקצב הדגימה צריך להיות לפחות כפול מהתדר הגבוה ביותר בדגימה. שזה בדיוק מה שראינו בדוגמא של התפוזים: אם היינו דוגמים עם מצלמת המסוע בדיוק בתדר של התפוזים, שהוא תפוז בכל שתי שניות, היינו עלולים לפספס לגמרי את ספירת התפוזים. אך אם נדגום מהר פי שניים, כלומר כל שניה, אז נצליח לספור את התפוזים. אותו הדבר תקף גם בדגימה מרחבית: אם הפיקסלים של המצלמה שלנו קטנים מספיק מהתפוזים המצולמים, נוכל לזהות ולהפריד בין התפוזים על מנת לספור אותם.

איך נראה קצב דגימה

לשם הפשטות, נחשוב על קצב דגימה במרחב הזמן, או במילים אחרות, כמה פעמים בזמן נתון נקליט דגימה של המידע. ניקח לדוגמא את אות הא.ק.ג, אות חשמלי שמייצג את פעילות הלב. האות הוא מחזורי, כלומר חוזר על עצמו, וצורתו האופיינית היא כזו:

הציר האופקי הוא ציר הזמן, והציר האנכי מראה את המתח החשמלי הנמדד בכל נקודת זמן. כל נקודה על הגרף הזה היא נקודת דגימה. אם קצב הדגימה שלנו מספיק מהיר, אנחנו נקבל את צורת האות האופייני. אם קצב הדגימה איטי מדי, נפספס את צורת האות ונקבל צורה לא נכונה.

מה המשמעות של קצב דגימה איטי מדי

קצב דגימה איטי מדי, מתבטא בכך שנקודות הדגימה נלקחות במרווחי זמן גדולים מדי על האות. לכן כאשר נסתכל רק על נקודות הדגימה, הדמיון לאות המקורי יהיה קטן. אם נתעלם מהאות עצמו ונסתכל רק על נקודות הדגימה, לא נוכל לשחזר את צורת האות המקורי.

מה המשמעות של קצב דגימה מהיר מדי

קצב דגימה מהיר מדי מתבטא בכך שנקודות הדגימה מאוד צפופות, באופן כזה שהצפיפות לא מוסיפה מידע הדרוש לשחזור האות. אם נשווה בין האיור האחרון לראשון, נראה שבמידה ונשחזר את האות מהנקודות בלבד, נקבל את אותה צורת אות. המשמעות היא, שהשתמשנו במקרה האחרון בנקודות דגימה רבות יותר (למעשה מספר כפול של נקודות דגימה) אך לא קבלנו מידע נוסף חשוב על צורת האות. במקרה כזה, שמרנו מידע מיותר, ו"נפחנו" סתם את גודל הדגימה שלנו. אם מדובר בהקלטה בודדת "ניפוח" המידע עשוי להיות חסר משמעות, אך כשמדובר בהקלטות רבות המידע העודף והמיותר עשוי להוריד את יעילות המערכת.

איך נדע האם ניתן להשתמש באות

תנאי ראשון לשימוש במידע הדגום, הוא שהמידע ייצג נאמנה את האות אותו רצינו להקליט. כלומר, אם "ננגן" את האות הדגום, הוא צריך להיות דומה מספיק לאות המקורי. מה זה אומר דומה מספיק? זה אומר שהמאפיינים החשובים של האות צריכים להופיע בו. ומה זה אומר מאפיינים חשובים? תלוי באות. לדוגמא באות הא.ק.ג, צריכים להופיע החלקים השונים של האות ברורים בצורה מובהקת. במקרה של ספירת תפוזים זמנית, חשוב לא לפספס תפוזים. במקרה של ספירת תפוזים מרחבית, חשוב שנדע להפריד בין התפוזים בתמונה של הארגז מלמעלה.

אז מה עושים עם המידע אחרי שדגמנו

אחרי שהמידע דגום ושמור אצלנו, נוכל לנתח אותו ולעבד אותו על מנת להסיק ממנו מסקנות. חשוב לזכור שקצב הדגימה צריך להיות מותאם לשימושים הרצויים במידע. אם נדגום בקצב דגימה איטי ונאבד מידע, לא תהיה לנו דרך לשחזר אותו בהמשך ונאלץ לדגום שוב את האות. המידע יכול לשמש כקלט לאלגוריתמים שונים, בהם גם אלגוריתמים של למידה עמוקה. היופי באלגורתמים של למידה עמוקה הוא שבגלל שהם נסמכים על הרבה מאוד מידע, לעיתים יוכלו למצוא תועלת גם בתמונות בעלות רזולוציה נמוכה שנדגמו בתדר מרחבי נמוך. כמות התמונות הגדולה לעיתים תפצה על המחסור באינפורמציה בכל תמונה.

דגימה מחדש וצמצום נפח הקובץ

לאחר לקיחת הדגימה והשמירה שלה, לעיתים נרצה לצמצם את גודל הקובץ, למשל לפני שליחה שלו במייל. פעולת הצמצום הזו היא למעשה דגימה מחדש של הדגימה המקורית. אם נחשוב רגע על נקודות הדגימה שמופיעות באות הא.ק.ג, זה אומר שבמקום לשמור את כל נקודות הדגימה, נשמור למשל כל נקודה שניה או שלישית. כעת הקובץ השמור יהיה קטן יותר, מפני שהוא מכיל פחות מידע.

איך לשמור תמונה בגודל מצומצם

יש דרכים רבות לעשות זאת, אני אציע דרך אחת ישירה ושתי דרכים עקיפות:

דרך ישירה: שימוש בתוכנת גרפיקה יעודית לעיבוד תמונה. למשל, התוכנה החינמית GIMP שהמלצתי עליה בעבר. ב-GIMP יש לטעון תמונה, ולאחר מכן ללחוץ על file ואז על export as. יפתח חלון בו תוכלו לעדכן את שם הקובץ המוקטן. לאחר מכן יש ללחוץ על export, ואז יפתח חלון עם סלייד של quality באחוזים. ככל שתורידו באחוזים את איכות התמונה, כך נפח הקובץ יקטן בהתאמה. מה שמאוד נוח כאן, הוא שאפשר לראות תצוגה מקדימה של התמונה באיכות מופחתת לפני שלוחצים על אישור.

דרך עקיפה וזריזה: שליחת התמונה באפליקציית וואטס-אפ ודומותיה. האפליקציה מקטינה באופן אוטומטי את נפח התמונות הנשלחות בה, ולכן אם נשלחה דרכה תמונה היא תשלח בגודל מצומצם הרבה יותר. לכן אם חשוב לכן לקבל תמונה בפורמט מלא, בקשו שישלחו לכן אותה במייל ולא באפליקציות כדוגמת וואטס-אפ.
דרך עקיפה ופחות זריזה: ניתן לטעון תמונה לתוכנה כמו פאואר פוינט, ולאחר מכן לשמור כקובץ תמונה רק את הסלייד אליו נטענה התמונה. תוכנת פאואר פוינט גם כן מכווצת את נפח התמונות הנטענות אליה.

חשוב לזכור ששמירת תמונה בדרכים האלו תוריד בהכרח את איכות התמונה, כי המידע אבד. לכן אם תזדקקו שוב לתמונה באיכות גבוהה, למשל בהדפסה, זיכרו להשתמש בתמונה המקורית.

אהבתן את הפוסט? מוזמנות לעקוב אחרי בפייסבוק, באינסטגרם ובטלגרם, או להרשם כאן ומבטיחה לעדכן אתכן בפוסטים חדשים:

*הפוסט נכתב בלשון נקבה אך מיועד לנשים, גברים ומגדרים אחרים בצורה שווה.