データ保持の指針

This page is a translated version of the page Legal:Wikimedia Foundation Data Retention Guidelines and the translation is 99% complete.

導入

データは大切です。データは、私たちが組織としてまた運動として、学び成長する方法の一つであり、データを使って創造や学びやシェアをする人達のため、これらのプロジェクト群をより良いものにする方法の一つでもあります。 それと同時に私たちは、利用者の個人データを「各ウィキメディア・サイト(Wikimedia Sites)のメンテナンス、理解、改善という目的に合致し、また該当する米国法の下の私たちの法的義務にも合致するに十分で、可能な限り短い期間のみ保持する」ことに責任を持って取り組みます。(上記はウィキメディア財団のプライバシー方針からの引用)

この文書はこの取り組みを達成する手順を説明するのに役立てるため、データ保持やシステム設計および継続している監査と保守のためのガイドラインを説明します。これらのガイドラインはつねに有効であり続けることを意図し - 時間の経過とともに更新され、保持に関するその時点の慣習を反映します。

これらのガイドラインはどんなデータに適用されるのか

これらのガイドラインは、ウィキメディアのサイトで収集されプライバシーの方針ならびにウィキ以外のプライバシーの方針Non-Wiki Privacy Policyによって保護される、全ての非公開データに適用されます。私たちの寄付者のプライバシー方針には、寄付者情報に適用される個別のデータ保持ガイドラインが含まれています。

非公開のデータを保持する期間の長さはどれくらいか

特に明記しない限り、財団は下記の期間を超えない範囲で次の種類のデータを保持します。

データの種類 入手元 最長保持期間
非公開の個人情報 利用者から自動的に収集
  • サイトを訪問する人のIPアドレス(運用データ)
  • A/Bテストの被験者のIPアドレス(分析データ)
  • サイトを訪問する人のユーザーエージェントを確認する
最長90日以内に、削除、集約、識別取り消しによる匿名化のいずれかの処理がされます。
アカウントの設定
  • メールアドレス
アカウントの設定を利用者が削除・変更するまで。
非個人情報 利用者から自動的に収集 無期限
最長90日以内に、削除、集約、識別の取り消しによる匿名化のいずれかの処理がされます。
利用者から提供
  • サイトの検索ボックスに入力された用語の記録、もしくは事前入力された検索エンジンへのリンク用語をユーザーナビゲーションが追跡した記録
最長90日以内に、削除、集約、識別の取り消しによる匿名化のいずれかの処理がされます。
利用者から提供
  • 言語
利用者がアカウントの設定を削除・変更するまで。
アカウントに関連付けされていない非個人情報[T 1] 様々な利用者から自動的に収集 無期限
読者が閲覧した記事 読者から自動的に収集
  • 読者が閲覧した記事の一覧
最長90日以後にもし保持するのであれば、集約形に限定
  1. このテーブルの目的上、「利用者アカウント」とは利用者の名前とIDまたはIPアドレスを意味します。「読者」とは、ウィキメディアプロジェクトへの訪問者を指します。

公開のデータを保持する期間の長さ

ウィキメディアは使命の一環として、ウィキペディアと関連プロジェクト群を主催し、人間の知識の総計を世界から集めて文書化し、無料で配布しています。したがって利用者が利用者ページやディスカッションページを含むウィキメディアサイトに貢献すると、利用者が追加、削除または変更したすべてのコンテンツに、恒久的な公開記録が作成されます。 ページの履歴には投稿または削除が行われた日時、利用者名(サインインしている場合)またはIPアドレス(サインインしていない場合)が表示されます。利用者向けの新機能やデータ関連製品の作成に、あるいはウィキメディアサイトの使われ方をもっと学ぶため、利用者と他の人の公開の貢献を合算してあるいは個別に使います。 誤ってウィキメディアサイトへの投稿に含めてしまった自分の個人情報を削除したい場合は、コミュニティのオーバーサイトの方針に相談してください。 ウィキペディアサイトの改訂履歴の透明性と完全性は使命に不可欠であり、財団はプロジェクト群の保護を目指してコミュニティが監視の要求を拒否する権利を支持します。

ウィキメディアプロジェクト群にアカウント登録をする場合、利用者名を決めるように求められます。利用者がアカウントの改名を要求するか、コミュニティのcourtesy vanishing(秘匿)プロセスにかかるまで、利用者名は保持されます。

詳細情報はプライバシーの方針をご参照ください。

定義

これらのガイドラインの目的のために:

  • 「個人情報」 とは利用者が提供する情報または当財団が収集する情報のうち、それを使って利用者を識別もしくは個人を特定できる情報のことです。詳細についてはウィキメディア財団のプライバシーの方針ならびにウィキ以外のプライバシーの方針Non-Wiki Privacy Policyをご参照ください。
  • 「公開情報」の例を示します。
    • (a) 利用者がログインせずに編集した場合はIPアドレス。
    • (b) 利用者がログインして編集した場合は利用者名。
    • (c) Wikimediaのサイト群で利用者自身が公開した本名や年齢などの情報すべて。
  • 「非公開情報」とみなされる種類の情報の例を示します。
    • (a) ログインして編集した場合の利用者のIPアドレス。
    • (b) アカウント作成時に(非公開で)登録した電子メールアドレス。
    • (c) 利用者が公開して投稿していない場合、IPアドレスから得られる利用者の一般的な位置情報。「公開」と対照して「非公開」と見なされる種類の情報の詳細は、プライバシーの方針で説明します。
  • 集約などにより利用者の識別ができない方法で入手したデータは「識別取り消し」により匿名化されます。
  • 特定の利用者に関するデータを他の人のデータと組み合わせて、特定の利用者を識別せず一般的な傾向もしくは価値を示す場合、データは「集約されます」

データの集約のしかたの例を示します。

数字で特定せず範囲を用いて、例えば「Y国にいるX言語の編集者1人から10人」のように示し、編集者が4人とは示さない。

この文書で定義されていない用語は、プライバシーの方針でそれらに示されたのと同じ意味を与えられます。

これらのガイドラインの例外

これらのガイドラインに例外事項を設定する場合は、このページで例外を説明しコミュニティに通知します。

  • データは長期間にわたってシステムバックアップに保存されることがあり、5年を超えない範囲とします。
  • アンケートその他の調査を行う場合は、このような調査への参加を通じて収集された情報(個人情報を含む)の保持期間を指定するプライバシーステートメントを利用者に提供します。場合によっては該当するプライバシー関連の声明に別段の記載がない限り、情報は教育、開発またはその他の関連目的で無期限に保持されることがあります。このような情報は、参加者から情報削除の要求を受けるまで、未加工あるいは集約ないし識別解除された形式で保持される場合があります。
  • 新型コロナウイルス感染症 (COVID-19)に関連する調査研究:ウィキメディア財団研究チームは、新型コロナウイルス感染症 (COVID-19)とウィキペディアへの影響に関して研究しています。 新型コロナウイルス感染症関連の記事から読者データを得て匿名化し保持すると、研究コミュニティはコンテンツ作成の優先順位付けの方法をより深く理解し、「システム体系が衝撃を受ける事態」が生じたときに読者に何が起こるかを理解し、私たちはそのような問題に対応できるようになります。ここで言う「COVID-19関連記事」とはリンク元のウィキデータ項目が2019年新型コロナウイルス感染症SARSコロナウイルス2および 2019–20年新型コロナウイルス感染症の世界的流行のいずれかであるものを指します。

比較の目的で、新型コロナウイルス感染症に無関係の記事少数からもデータを保持します。十分なデータ収集と、時間の経過に伴う読者層の状況把握には、この匿名化されたデータは通常の保存制限90日間を超えて2021年3月1日まで1年間、保存します。(注記:これには人員配置変更に伴うプロジェクト完了時期の1ヵ月延長が含まれます。) 対象群の選出と匿名化プロセスの技術面の詳細は、GitHub でプロジェクトページをご参照ください。

  • 調査の編集:トークページの返信を改善するために実験的な機能を設け、その一部として収集したデータには、短期の拡張機能を適用します。十分なデータ収集と分析には、このデータの保持期間を標準の90日よりも長く保存する必要があります。保持データは180日以内に削除、集約または匿名化します。
  • キャンペーンの扉ページ)(ランディング・ページ):個別のイベントやキャンペーンまたはマーケティングのチャネルでは、特設の扉ページで利用者アカウントを作成できる場合があります。そのようなページで作成したアカウントはその後、そのアカウントの大元と関連付けして無期限に保持する場合があり、そのアカウントに優れたユーザー体験の提供と、キャンペーンの効果に関する長期的な分析の両方に使います。詳細はmmiller wikimedia.org までお問い合わせください。
  • CampaignEvents 拡張機能:CampaignEvents 拡張機能に従って収集したデータには例外が存在します。この拡張機能はイベントの主催者と参加者から利用者のグローバルIDを取得、また各人がどのイベントの主催・参加側にいたか、イベントに参加登録した時期も収集する情報に含まれます。拡張機能の一貫した動作を確保するため、CampaignEvents 拡張機能の収集データの保持は無期限とする場合があります。
  • 音声ロゴ・コンテスト:コンテストの応募段階の一環として収集したデータはブランド・スタジオ・チームに応募作を評価させようと、2023年2月の受賞者発表に備えて期間を短く延長します。保持したデータは勝者の発表から90日以内に削除、集約または匿名化します。
  • Webrequest datasets: There is a short, one-time extension for data from the wmf.webrequest and wmf.pageview_actor datasets. This data needs to be retained longer than usual while we correct an error in the way unique devices are calculated from the dataset. Accurate unique device statistics are necessary for engineering purposes and legal reporting requirements. The underlying data used to calculate these statistics will be retained for an extra 30 days beyond the ordinary 90-day deletion period. After 30 days, the affected data will be purged and retention settings will reset back to 90 days.
  • まれに、当財団またはそのプライバシー方針に記載された特定の管理者権限を持つ特定の利用者は、利用者のIPアドレスおよびユーザーエージェント情報を含む個人情報を、合理的な(上記の表に記載された)期間、保持する必要がある場合があります。
    • 利用規約ならびにこのプライバシーの方針または財団もしくは利用者コミュニティごとの方針に対する、違反の有無を判定または調査します。
    • 法的な脅威や行為に対して調査し、防御します。
    • ウィキメディアサイト上における破壊的な行為全般を最小限に抑えることを目指して、破壊行為や虐待から保護し、他の利用者の嫌がらせ行為に対抗します。
    • 人体への差し迫った重大な危害または死亡を防止するため、あるいはまた当財団の組織や従業員、請負業者や利用者または公衆を保護するため。
    • 潜在的なスパムやマルウェア、詐欺や悪用、違法行為およびセキュリティ上または技術上の問題を検出、防止または評価して対処します。

監査と改良

財団はこれらのガイドラインを継続して評価し改善し、それら改善を特定する定期的な監査に取り組んでいます。既存(訳注:のガイドライン)やシステムに変更を加えるときは、変更された慣行を反映させるため、これらガイドラインを更新します。

新しいシステムの設計

これらデータ保持期間と総合的なプライバシーの方針を支えるには、財団はプライバシーを念頭に置いて新しいツールとシステムを実装し設計します。これには以下が含まれます。

  • これらのデータ保持ガイドラインを、設計過程の要件として含める。
  • 設計と開発段階で法律的な相談をする。さらに
  • コードリビューの過程にプライバシーへの配慮を含める。

進行中の新規情報の取り扱い

たとえ新システムの設計と実装に最大努力を払っても、時にはこれらのガイドラインに従わない方法で個人情報を記録する場合があります。そのような見落としを発見した場合は、必要に応じて情報を迅速に削除、集約もしくは識別できなくすることにより、ガイドラインを順守します。

お問い合わせ

もし、これらガイドラインに潜在的に不整合の部分があると思われた場合や、ガイドラインの説明責任に関して疑問点やコメントがあるのでしたら、privacy wikimedia.org まで連絡して下さい。

プライバシーに関するページ