הערך של הנתונים

(של ג'ורג'יו טוסי)
16/02/22

ידוע כי באינטרנט יש המון נתונים מסוגים ומקורות שונים. נתונים שזמינים בדרך כלל לייעוץ באמצעות אותם דפדפנים המאפשרים לנו ליצור אינטראקציה עם הרשת בדרכים שיכולות להיות רק טקסטואליות (קריאת מאמר, למשל) או אפילו מולטימדיה (אודיו, וידאו וסטרימינג).

לכן נראה שכל הנתונים הללו זמינים לכל אחד וניתן להשתמש בהם כדי לחלץ מידע שיכול לעזור לנו להנחות את הבחירות היומיומיות שלנו.

במציאות, הדברים אינם כה שקופים ופשוטים. שיטות השימוש בנתונים אלו נועדו למעשה לאינטראקטיביות המייחדת את מערכת היחסים בין אדם למכונה. קשיים מתעוררים כאשר אתה רוצה לעשות שימוש חוזר בנתונים אלה כדי לעבד אותם בצורה אישית כדי לחלץ מידע בעל עניין ספציפי למשתמש הבודד.

לשם הבהרה, אנו מתייחסים למקרה של מחירי המניות של כל שוק (בורסה איטליאנה, ניסה או נאסד"ק...): ישנם מספר רב של אתרים המאפשרים ניתוח של ביצועי מניה (TICKER) ומספקים שלם סדרת נתונים קשורים הערך, הכמויות המטופלות, המקסימום והמינימום היומיים וכן הלאה. הממשק לנתונים אלו הוא, כאמור, הממשק האופייני לאינטראקציה בין אדם למכונה: הדפדפן.

אם הייתי רוצה לעבד את הנתונים האלה באופן מקומי כדי לחלץ מידע שמעניין אותי, הדברים מסתבכים באופן משמעותי. כדי לגשת לאותם נתונים מממשק פרוגרמטי, 2 שיטות זמינות: ה גירוד באינטרנט או גישה דרך ממשק נתונים ספציפי כגון API REST (העברת מצב ייצוגי) או SOAP (Simple Object Access Protocol), כאשר REST הוא ללא ספק הפתרון הנפוץ והשימושי ביותר.

ננתח בקצרה את שתי החלופות. ה גירוד באינטרנט מבוסס על חיקוי של התנהגות אנושית על ידי העברת דף האינטרנט המעניין ללקוח ולאחר מכן התערבות בו בחיפוש אחר הנתונים המעניינים על ידי זיהוי של דפוס הכרה ידועה. לדוגמה, שימוש בתגי HTML מסוימים המאפשרים לך לזהות את הנתונים המעניינים את כוונת דף ה-HTML.

למרות שספריות זמינות בשפות תכנות שונות (JavaScript, Python, Java,...) המאפשרות איכשהו את הזיהוי והזיהוי של הנתונים המסוימים, ההליך אינו מיידי ונוטה לשגיאות. יתר על כן, אם דף ה-HTML של המקור משתנה, ייתכן שה- תסריט מפותח שגוי כי דפוס זיהוי (לדוגמה התג המזהה את הנתונים השתנה) לכן פתרון זה, אם כי אפשרי, יכול להיות בעייתי בשל מורכבות היישום והתלות הקפדנית במבנה דף ה-HTML.

הפתרון המבוסס על ממשק פרוגרמטי API REST (או SOAP) הוא בהחלט חזק יותר וקל יותר ליישום.

המשימה של ממשקים אלה היא לתקן את שיטות הגישה לנתונים. במקרה של ממשקי REST, לכן ייעשה שימוש בטכנולוגיית HTTP והנתונים המבוקשים יקראו באמצעות GETs בכתובות URL ספציפיות הבנויות באופן שיזהה באופן ייחודי את הנתונים המעניינים.

כדוגמה, אני מדווח על כתובת האתר לגישה לממשק REST של שירות המרת המטבעות שמסופק על ידי בנק איטליה.

https: //tassidicambio.bancaditalia.it/terzevalute-wf-web/rest/v1.0/dailyRates?referenceDate= {נתונים} & baseCurrencyIsoCode = {מ} ¤cyIsoCode = {אל} & lang = {“it"}

המונחים המודגשים משמשים להגדרת המטבעות המעורבים ותאריך ההערכה של יחס ההמרה. פעולת GET בכתובת ה-URL הזו תחזיר את הערך שחיפשת. ניתן ליישם פעולה זו בקלות מכל שפת תכנות (Python, Javascript, C #,...) באמצעות שימוש בספריות מתאימות.

למרות שישנם שירותים חינמיים רבים המבוססים על סוג ממשק זה, מעניין לציין כי ישנם אתרים רבים המציעים מידע פיננסי בתשלום. לרוב מדובר בנתונים מפורטים במיוחד המציעים סקירה מלאה של היבטים הקשורים למידע פיננסי הנוגע לשווקים ולחברות ברחבי העולם. ברצוני להדגיש שרבים מהאתרים הללו, במיוחד אלה הקשורים להיבטים כלכליים ופיננסיים, מציעים גישה מלאה רק כנגד צורה כלשהי של מנוי.

בעיקרון, השימוש בנתונים באמצעות ממשק פרוגרמטי כפוף לתשלום. מה שעוזר לחזק תפיסה בסיסית שהרבה פעמים מתעלמים ממנה: באינטרנט, הערך האמיתי הוא בנתונים. אם לנתונים המצטברים והשמישים, אך עדיין ציבוריים, של חברות רשומות יש ערך ספציפי והם נושא להצעות מנוי, נוכל לדמיין איזה ערך יש לנתונים האישיים שלנו שמסרנו, פחות או יותר ביודעין, למספר רב של חברות. שהם מנהלים אתרי מסחר אלקטרוני או רשתות חברתיות.

ריפרימינטי

אחד מהאתרים הרבים שמציעים מידע פיננסי מבוסס מנויים https://site.financialmodelingprep.com/developer/docs/pricing

העמקה בממשק REST https://www.ibm.com/cloud/learn/rest-apis