הנחיות להחזקת נתונים
מבוא
נתונים הם דבר חשוב. אנחנו יכולים ללמוד מהם, כארגון ותנועה, על הדרך בה אנחנו יכולים לשפר את המיזמים שלנו עבור המשתמשים ולהקל עליהם ליצור, ללמוד ולשתף. בו בזמן, אנחנו מחויבים להחזיק בנתונים פרטיים שלכם "לזמן הקצר ביותר האפשרי בהתחשב בתחזוקת אתרי ויקימדיה, בהבנתם ובשיפורם, ותוך מחויבות ליישום החוקים החלים בדיני ארצות הברית" (ציטוט ממדיניות הפרטיות של קרן ויקימדיה).
במסמך זה נסביר על הדרך בה אנחנו ממלאים התחייבות זו באמצעות תיאור הקווים המנחים להחזקת נתונים, לתכנון המערכת ולביקורת ולתחזוקה שוטפות. קווים מנחים אלו אמורים להיות מסמך חי - הם יתעדכנו עם הזמן כך שישקפו את שיטות ההחזקה הנוכחיות.
על אילו נתונים חלים הקווים המנחים?
הקווים המנחים הללו תקפים עבור כל מידע לא-ציבורי שאנו אוספים באתרי וויקימדיה המכוסה במדיניות הפרטיות.
למשך כמה זמן אנו מחזיקים נתונים לא-ציבוריים?
אנו מחזיקים בסוגי המידע הבאים למשך פרקי הזמן הבאים לכל היותר, אלא אם כן מצויין אחרת:
סוג המידע | מקור | דוגמאות | תקופת אחזקה מקסימלית |
---|---|---|---|
מידע אישי | נאסף אוטומטית מהמשתמש |
|
לאחר 90 ימים לכל היותר, הוא ימחק, יסתכם, או יֵעשה בלתי מזוהה |
הגדרות חשבון |
|
עד שהמשתמש מוחק\משנה את ההגדרה בחשבון. | |
מידע שאינו אישי | נאסף אוטומטית מהמשתמש |
|
לזמן בלתי מוגבל |
|
לאחר 90 ימים לכל היותר, הוא ימחק, יסתכם, או יֵעשה בלתי מזוהה | ||
נמסר בידי המשתמש |
|
לאחר 90 ימים לכל היותר, הוא ימחק, יסתכם, או יֵעשה בלתי מזוהה | |
ניתן בידי המשתמש |
|
עד שהמשתמש מוחק את ההגדרה בחשבון או משנה אותה. | |
מידע לא־אישי שאינו מקושר לחשבון משתמש[T 1] | נאסף אוטומטית ממשתמשים שונים |
|
לזמן בלתי מוגבל |
מאמרים שניצפו על ידי משתמש מסוים | נאסף אוטומטית מהקוראים |
|
אם המידע נשמר, הוא ימחק או יסתכם לאחר 90 ימים לכל היותר |
- ↑ הגדרות לצורך הטבלה: "חשבון משתמש" – שמו, מספר הזיהוי שלו, או כתובת IP; "קוראים"– מבקרים במיזם ויקימדיה.
למשך כמה זמן אנחנו מחזיקים נתונים ציבוריים?
Wikimedia hosts Wikipedia and the associated projects as part of our mission to collect, document, and freely distribute the sum of human knowledge to the world. Accordingly, when you make a contribution to any Wikimedia Site, including on user or discussion pages, you are creating a permanent, public record of every piece of content added, removed, or altered by you. The page history will show when your contribution or deletion was made, as well as your username (if you are signed in) or your IP address (if you are not signed in). We may use your public contributions, either aggregated with the public contributions of others or individually, to create new features or data-related products for you, or to learn more about how the Wikimedia Sites are used. If you mistakenly included your personal information in a contribution to a Wikimedia Site and you would like to have it removed, please consult the community's oversight policy. Keep in mind that the transparency and integrity of our sites' revision histories is essential to our mission, and the Foundation supports our community's right to reject oversight requests in order to protect the projects.
If you choose to register for an account with the Wikimedia projects, you will be asked to select a username. Usernames are retained until the user requests that the account be renamed, or goes through the community courtesy vanishing process.
For more information, see our Privacy Policy.
הגדרות
לצורך ההנחיות הללו:
- מידע אישי משמעו מידע שאת מספקת לנו או מידע שאנחנו אוספים ממך שיכול לשמש לזיהוי שלך. לשם הבהרה, בעוד שאנחנו לא אוספים בהכרח את כל סוגי המידע הבאים, אנחנו מחשיבים אותו, לכל הפחות, כ"מידע אישי" אם הוא אחרת לא-ציבורי ויכול לשמש לזיהוי שלך:
- Some examples of "public information" would include:
- (a) your IP address, if you edit without logging in;
- (b) your gender, if it is disclosed under your user profile;
- (c) any personal information you disclose publicly on the Wikimedia Sites, such as your real name or age.
- Some examples of types of information that are considered to be "nonpublic information" include:
- (a) your IP address, if you edit while logged in;
- (b) your email address, if you provided one to us during account registration (but did not post it publicly); and
- (c) your general location information as might be derived from your IP address, if you have not posted it publicly. The types of information that are considered "nonpublic" as opposed to "public" are more fully explained in our Privacy Policy.
- Data is "de-identified" when it has been aggregated or otherwise retained in a manner such that it can no longer be used to identify the user.
- מידע "מסתכם" כאשר המידע המקושר עם משתמש מסויים שולב עם מידע ממשתמשים אחרים על מנת להראות מגמות או ערכים כלליים בלי לזהות משתמשים מסוימים.
דוגמה כיצד ניתן לסכם מידע:
- שימוש בטווח ערכים במקום במספרים מסוימים, כגון קביעה כי ישנם "בין 1 ל10 עורכים בשפה X במדינה Y" לעומת קביעה כי ישנם 4 עורכים.
Terms that are not defined in this document have the same meaning given to them in the Privacy Policy.
יוצאי-דופן לקווים המנחים הללו
במידה ויהיו יוצאי-דופן לכללים הללו, אנו נודיע על כך לקהילה על ידי תאור יוצא הדופן בדף זה.
- הנתונים עשויים להישמר בגיבויי מערכת לתקופות זמן ארוכות יותר, שלא יעלו על 5 שנים.
- When we conduct a survey or other research, we will provide you with a privacy statement specifying the term of retention for information (including personal information) collected through your participation in such research. In certain cases, information may be retained indefinitely for educational, development, or other related purposes, unless otherwise indicated in the relevant privacy statement. Such information may be retained in raw, aggregated, or de-identified form until we receive a request from the participant to delete the information.
- Research related to COVID-19: The Wikimedia Foundation Research team is conducting research regarding COVID-19 and its impact on Wikipedia. Retaining de-identified readership data from COVID-19 related articles will enable us to better understand how to prioritize content creation, to understand what happens to readership when there is a "shock to the system", and to empower the research community to answer such questions. By "COVID-19 related articles", we mean articles that link to the COVID-19, SARS-CoV-2 and 2019-2020 COVID-19 pandemic Wikidata items. For comparison purposes, we will retain data from a small number of articles unrelated to COVID-19 as well. In order to collect sufficient data, and obtain a picture of readership as time passes, we will be retaining this de-identified data beyond the 90-day retention limit, for a period of one year, ending on March 1, 2021. (Note that this includes a one-month extension due to staffing changes, in order to allow for the project's completion.). For technical details about the sampling and de-identification process, please see the project page on GitHub.
- Editing research: There is a short-term extension applying to data collected as part of experimental features to improve replying on talk pages. In order to collect and analyze sufficient data, this data must be kept beyond the standard 90-day period. The retained data will be deleted, aggregated, or de-identified within 180 days.
- Campaign landing pages: for certain events, campaigns, or marketing channels, users may create accounts on special landing pages. After creating their account on those pages, the association between their account and its source may be retained indefinitely, both to provide a good user experience for that account and for longitudinal analysis on campaign effectiveness. For more information, contact mmiller wikimedia.org.
- CampaignEvents extension: An exception exists for data collected by the CampaignEvents extension. The extension collects the global user IDs of event organizers and event participants, as well as which events users organized or attended and when participants registered for an event. In order for the extension features to work consistently, data collected by the CampaignEvents extension may be retained indefinitely.
- Sound logo contest: There is a short-term extension applying to data collected as part of contest entries to allow the brand studios team to evaluate entries in preparation for announcing the winner in February 2023. The retained data will be deleted, aggregated or de-identified within 90 days after the winner is announced.
- Webrequest datasets: There is a short, one-time extension for data from the wmf.webrequest and wmf.pageview_actor datasets. This data needs to be retained longer than usual while we correct an error in the way unique devices are calculated from the dataset. Accurate unique device statistics are necessary for engineering purposes and legal reporting requirements. The underlying data used to calculate these statistics will be retained for an extra 30 days beyond the ordinary 90-day deletion period. After 30 days, the affected data will be purged and retention settings will reset back to 90 days.
- In rare cases, we, or particular users with certain administrative rights as described in our Privacy Policy, may need to retain your personal information, including your IP address and user agent information, for as long as reasonably necessary (which may be longer than the period described in the table above) to:
- enforce or investigate potential violations of our Terms of Use, this Privacy Policy, or any Foundation or user community-based policies;
- investigate and defend ourselves against legal threats or actions;
- help protect against vandalism and abuse, fight harassment of other users, and generally try to minimize disruptive behavior on the Wikimedia Sites;
- prevent imminent and serious bodily harm or death to a person, or to protect our organization, employees, contractors, users, or the public; or
- detect, prevent, or otherwise assess and address potential spam, malware, fraud, abuse, unlawful activity, and security or technical concerns.
Audits and improvements
The Foundation is committed to continuous evaluation and improvement of these guidelines, and to periodic audits in order to identify such improvements. As we make changes to existing and systems, we will update these guidelines to reflect our changing practices.
עיצוב של מערכות חדשות
על מנת לתמוך בתקופות שמירת נתונים אלה ומדיניות הפרטיות הכללית שלנו, כלים חדשים ומערכות המיושמות על ידי הקרן יהיה מעוצבות עם חשיבה בנושא הפרטיות. בכלל זה:
- הכללה של הנחיות שמירת נתונים אלה כדרישות במהלך תהליך העיצוב;
- ייעוץ משפטי במהלך תהליך העיצוב ופיתוח; ו-
- הכללת שיקולי פרטיות בתהליך בדיקת קוד.
טיפול שוטף במידע החדש
למרות מיטב מאמצינו בעיצוב ופריסה של מערכות חדשות, אנו עשויים מדי פעם לרשום מידע אישי באופן שאינו עומד בהנחיות אלה. כאשר אנו מגלים בעיה כזו, אנחנו מייד נקיים את ההנחיות על ידי מחיקה, צבירה, או הפיכת המידע לאנונימי על פי צורך.
יצירת קשר
אם אתה חושב שהנחיות אלה עלולות להיות מופרות, או אם יש לך שאלות או הערות על עמידה בהנחיות, אנא פנה אלינו ל-privacy wikimedia.org.