知識ベース

ゲドコム

GEDCOM (/ ˈdʒɛdkɒm / JED-kom )(Genaelogical Data Communicationの頭字語)は、異なる系図ソフトウェア間で系図データを交換するためのオープンな事実上の仕様です。 GEDCOMは、系図研究の支援として、末日聖徒イエス・キリスト教会(LDS教会)によって開発されました。

GEDCOMファイルは、個人に関する系譜情報とこれらのレコードをリンクするメタデータを含むプレーンテキスト(通常はANSELまたはASCII)です。ほとんどの系図ソフトウェアは、GEDCOM形式からのインポートとGEDCOM形式へのエクスポートをサポートしています。ただし、一部の系図ソフトウェアプログラムには、GEDCOM 5.5 EL(Extended Locations)仕様など、他の系譜プログラムによって常に認識されるとは限らない、独自の拡張機能が使用されています。

GEDCOM Xと他のいくつかの仕様が代替品として提案されていますが、現在の1996バージョンは20年後の業界標準のままです。

GEDCOMモデル

GEDCOMは、系統にリンクされたデータモデルを使用します。このデータモデルは、核家族と個人に基づいています。これは、裏付けとなる証拠を反映するようにデータが構造化されている証拠ベースのモデルとは対照的です。 GEDCOM系統にリンクされたデータモデルでは、すべてのデータは、信じられている現実、つまり実際の(または仮定された)核家族および個人を反映するように構造化されています。

GEDCOMファイル構造

GEDCOMファイルは、ヘッダーセクション、レコード、およびトレーラーセクションで構成されます。これらのセクション内で、レコードは、人(INDIレコード)、家族(FAMレコード)、情報源(SOURレコード)、およびメモを含むその他のレコードを表します。 GEDCOMファイルのすべての行は、すべての最上位レコード(HEAD、TRLR、SUBN、および各INDI、FAM、OBJE、NOTE、REPO、SOUR、およびSUBM)がレベル0の行で始まるレベル番号で始まります。他のレベル番号は正の整数です。

GEDCOMファイルを手動で書き込むことは理論的には可能ですが、この形式はソフトウェアで使用するように設計されているため、特に人に優しいわけではありません。 GEDCOMファイルの構造を検証するために使用できるGEDCOMバリデーターは、PhpGedViewプロジェクトの一部として含まれていますが、スタンドアロンのバリデーターではありません。スタンドアロン検証では、「Windows GEDCOM Validator」または末日聖徒イエス・キリスト教会の古いメンテナンスされていないGedcheckを使用できます。

2001年、 GEDCOM TestBook Projectは、4つの一般的な家系図プログラムが、Gedcheckプログラムを使用してGEDCOM 5.5標準にどれだけ適合しているかを評価しました。調査結果は、多くの問題が存在し、「データ損失につながる最も一般的な障害は、NOTEタグが表示される可能性のあるすべてのレベルでの読み取りの失敗である」ことを示しました。 2005年に、 系図ソフトウェアレポートカードが評価され(元のGEDCOMテストブックプロジェクトに参加したビルマンフォードによって)、Gedcheckプログラムを使用したGEDCOM 5.5標準のテストが含まれました。

sample.ged
0 HEAD 1 SOUR PAF 2 NAME Personal Ancestral File 2 VERS 5.0 1 DATE 30 Nov 30 2000 1 GEDC 2 VERS 5.5 2 FORM LINEAGE-LINKED 1 CHAR ANSEL 1 SUBM @ U1 @ 0 @ I1 @ INDI 1 NAME John / Smith / 1 SEX M 1 FAMS @ F1 @ 0 @ I2 @ INDI 1 NAME Elizabeth / Stansfield / 1 SEX F 1 FAMS @ F1 @ 0 @ I3 @ INDI 1 NAME James / Smith / 1 SEX M 1 FAMC @ F1 @ 0 @ F1 @ FAM 1 HUSB @ I1 @ 1 WIFE @ I2 @ 1 MARR 1 CHIL @ I3 @ 0 @ U1 @ SUBM 1 NAME Submitter 0 TRLR

以下はサンプルGEDCOMファイルです。

ヘッダー(HEAD)には、ソースプログラムとバージョン(Personal Ancestral File、5.0)、GEDCOMバージョン(5.5)、文字エンコード(ANSEL)、およびファイルの送信者に関する情報へのリンクが含まれます。

個々のレコード(INDI)は、John Smith(ID I1)、Elizabeth Stansfield(ID I2)、およびJames Smith(ID I3)を定義します。

家族記録(FAM)は、夫(HUSB)、妻(WIFE)、および子供(CHIL)をID番号でリンクします。

バージョン

仕様の現在のバージョンは1996年1月12日にリリースされたGEDCOM 5.5です。1999年にGEDCOM 5.5.1仕様のドラフトが発行され、WWW、EMAIL、FACTを含む9つの新しいタグが導入され、UTF-8が承認された文字エンコーディング。このドラフトは正式には承認されていませんが、その規定はいくつかの家系図プログラムで一部採用されており、FamilySearch.orgで使用されています。 PAF 5.2はGEDCOM 5.5をサポートしますが、PAF 5.2はGEDCOM 5.5.1ドラフトで導入された機能であるUTF-8を内部文字セットとして使用し、UTF-8 GEDCOMを出力できます。

2002年1月23日に、完全な仕様ではなかったため、GEDCOM 6.0のドラフト(ベータ)バージョンが開発者の研究専用にリリースされ、開発者はソフトウェアでの実装を開始しないことが推奨されました。たとえば、タグの意味と予想される内容の説明は含まれていません。 GEDCOM 6.0は、データをXML形式で保存する最初のバージョンであり、優先文字セットをANSELからUnicodeに変更することでした。

系統にリンクされたGEDCOMは、事実上の共通分母です。 1996年に最初に公開されたGEDCOM規格のバージョン5.5にもかかわらず、多くの系図ソフトウェアサプライヤーは、このバージョンの仕様で導入された(ANSEL文字セットの代わりに)多言語Unicodeテキストの機能をまだサポートしていません。 Unicodeを均一に使用すると、国際文字セットを使用できます。例としては、東アジアの名前を元の中国語、日本語、韓国語(CJK)文字で保存する場合があります。

リリース履歴

意味
古い標準/ドラフト。サポートされていません
古い標準;まだサポートされています
現在の標準
今後のドラフト
GEDCOMバージョン発売日ノート
1.0 1984 -
2.0 1985年12月 PAF 2.0
2.1 1987年2月 PAF 2.1用GEDCOM
2.3ドラフト 1985年8月7日 PAF2.0 GEDCOM実装規約
2.4ドラフト 1985年12月13日 PAF2.0 GEDCOM実装規約
3.0標準 1987年10月9日 3.0のPAF 2.0および2.1実装
4.0標準 1989年8月 PAF 2.1-2.31
4.1ドラフト - -
4.2ドラフト 1990年1月25日 -
5.0ドラフト 1991年12月31日系統にリンクされた構造が導入されました。
5.1ドラフト 1992年9月18日 -
5.2ドラフト 1992年1月22日 -
5.3ドラフト 1993年11月4日 Unicode標準(ISO / IEC 10646)は、追加の文字セットとして導入されました。
5.4ドラフト 1995年8月21日 -
5.5標準 1995年12月11日 PAF 3、4、および5
5.5標準 1996年1月2日 PAF 3、4、および5 / 5.5標準
GEDCOM(将来の方向)ドラフト 1998年5月1日 「まったく新しいデータモデルを使用した」
5.5.1ドラフト 1999年10月2日承認された文字エンコードとして追加されたFamilySearch.orgUTF-8によって使用されます。
5.6プライベートドラフト - 「Jed Allenは、これら2つのファイルを「プライベートコメント」のような目的で少数の人々に送信しました。
6.0 XMLドラフト 2001年12月28日完全な仕様ではなく、ソフトウェアの実装を開始することも推奨されていません。

制限事項

複数人のイベントとソースのサポート

GEDCOMファイルには、出生、死亡、国勢調査の記録、船の記録、結婚などのイベントに関する情報を含めることができます。経験則では、イベントは特定の時間に、特定の場所で(時間と場所がわからなくても)発生したものです。 GEDCOMファイルには、物理​​的な説明、職業、子供の総数などの属性を含めることもできます。イベントとは異なり、属性は通常、特定の時間または場所に関連付けることはできません。

GEDCOM仕様では、各イベントまたは属性は、正確に1人の個人または家族に関連付けられている必要があります。これにより、実際の人口調査エントリに複数の個人に関する情報が含まれていることが多い国勢調査記録などのイベントの冗長性が生じます。 GEDCOMファイルでは、国勢調査の記録については、個別の国勢調査「CENS」イベントを、参照される各個人に追加する必要があります。 GrampsやThe Master Genealogistなどの一部の系図プログラムには、特に複数人のイベントを表現するために使用されるソースの精巧なデータベース構造があります。データベースがこれらのプログラムの1つからGEDCOMにエクスポートされると、これらのデータベース構造はこの制限のためGEDCOMで表すことができません。その結果、関連するすべての引用参照情報を含むイベントまたはソース情報を複製する必要があります。中古。この重複により、ユーザーはソースに関連する情報を維持することが難しくなります。

GEDCOM仕様では、結婚情報などの家族に関連付けられたイベントは、家族(FAM)レコードの一部としてGEDCOMに1回だけ保存され、その後、両方の配偶者がその単一の家族レコードにリンクされます。

仕様のあいまいさ

GEDCOM仕様は、特にソースの領域でデータをエンコードする多くの方法をサポートするために、意図的に柔軟になりました。この柔軟性により、多くのあいまいさが生じ、GEDCOMをインポートする一部の系図プログラムがファイルからすべてのデータをインポートしないという副作用が生じました。

家族および関係のさまざまな定義のサポート

GEDCOMは、同性結婚、国内のパートナーシップ、同居、一夫多妻、一夫多妻など、多くの種類の緊密な対人関係のデータ表現を明示的にサポートしていません。このような関係は、あらゆるタイプの関係に使用される汎用ASSOタグを使用してのみ表現できます。

日付のないイベントの順序付け

GEDCOM仕様では、既知のイベントの順序を維持するための明示的なサポートは提供されていません。特に、個人の関係の順序(FAMS)と関係内の子の順序(FAM)が失われる可能性があります。多くの場合、イベントのシーケンスは関連する日付から導出できます。ただし、特に数世紀前のデータを扱う場合は特に、日付が常にわかっているとは限りません。たとえば、ある人が2つの関係を持ち、どちらも日付が不明な場合、説明から、2番目の関係が実際に2番目の関係であることがわかります。これらのFAMSがGEDCOMのINDIレコードに記録される順序は、エクスポートプログラムによって異なります。たとえば、Aldfaerでは、シーケンスはユーザーによるデータの順序(アルファベット順、時系列、参照など)に依存します。提案されているXML GEDCOM標準は、この問題にも対処していません。

あまり知られていない機能

GEDCOMには、一般的に使用されない多くの機能があるため、一部の人々には知られていません。一部のソフトウェアパッケージは、GEDCOM標準で許可されているすべての機能をサポートしていません。

マルチメディア

GEDCOM規格は、マルチメディアオブジェクト(個人の写真など)の包含をサポートしています。このようなマルチメディアオブジェクトは、GEDCOMファイル自体(「埋め込みフォーム」と呼ばれる)またはGEDCOMファイルで外部ファイルの名前が指定されている外部ファイル(「リンクフォーム」と呼ばれる)に含めることができます。 GEDCOMファイルに直接マルチメディアを埋め込むと、すべての情報(マルチメディアデータを含む)が1つのファイルに格納されますが、結果のファイルは膨大になる可能性があるため、データの送信が容易になります。マルチメディアをリンクすると、GEDCOMファイルのサイズが制御されますが、ファイルを送信するときは、マルチメディアオブジェクトを個別に送信するか、GEDCOMと一緒に1つの大きなファイルにアーカイブする必要があります。メディアの直接埋め込みのサポートは、ドラフト5.5.1標準では削除されました。

矛盾する情報

GEDCOM規格では、同じタイプの複数のレコードを指定するだけで、複数の意見や矛盾するデータを指定できます。たとえば、個人の生年月日が1800年1月10日として出生証明書に記録され、1800年1月11日が死亡証明書に記録された場合、その個人の2つのBIRTレコードが含まれ、1つ目は1800年1月10日で出生ソースとしての証明書、および1800年1月11日の日付を持つ2番目の証明書、およびソースとしての死亡証明書。通常、優先レコードが最初にリストされます。

GEDCOMでエンコードされたこの例は、次のようになります。

0 @ I1 @ INDI 1名前John / Doe / 1 BIRT 2 DATE 10 1月1800 2 SOUR @ S1 @ 3 DATA 4 TEXT出生証明書からの転記はここに行く3注この出生記録は、出生証明書から来るため優先される3 QUAY 2 1 BIRT 2 DATE 11 JAN 1800 2 SOUR @ S2 @ 3 DATA 4 TEXT死亡証明書の転記はここに行きます3 QUAY 2

競合するデータは、ユーザーエラーの結果である可能性もあります。標準では、 内容が一貫している必要があることを指定していません。 「10 APR 1819」のような生年月日は、人の死後ずっと「10 APR 1918」と誤って記録された可能性があります。このような矛盾を明らかにする唯一の方法は、 コンテンツデータの厳密な検証によるものです。

国際化

GEDCOM標準は、いくつかの方法で国際化をサポートしています。まず、新しいバージョンの標準では、データをUnicode(または最近ではUTF-8)で保存できるため、任意の言語のテキストを保存できます。次に、人に複数のイベントを設定できるのと同じように、GEDCOMを使用すると、人に複数の名前を付けることができるため、名前を複数の言語で保存できます(ただし、どのインスタンスがどの言語にあるかを示す標準化された方法はありません) )。最後に、最新のドラフトバージョン(5.5.1、まだ広く使用されていない)では、NAMEフィールドは名前の音声のバリエーション(FONE)とローマ字のバリエーション(ROMN)もサポートしています。

GEDCOM X

2012年2月のRootsTech 2012カンファレンスで、FamilySearchはGEDCOM Xと呼ばれる家系標準に関する主要な新しいプロジェクトの概要を説明し、コラボレーションを招待しました。 Apacheオープンソースライセンスで開発されたソフトウェアが含まれます。これには、ソースとレコード(物理的なアーティファクトとデジタルアーティファクトの両方)に基づいた家系図の作成を容易にするデータ形式、オンラインでのデータの共有とリンクのサポート、およびAPIが含まれます。

2012年8月、FamilySearchの従業員およびGEDCOM XプロジェクトリーダーのRyan Heatonは、GEDCOM Xが新しい業界標準であるという主張を破棄し、GEDCOM Xを別のFamilySearchオープンソースプロジェクトとして再配置しました。

GEDCOMの代替

系譜ソフトウェアのルーツシリーズとUltimate Family Treeの作成者であるCommsoftは、イベント指向のGEDCOM(「Event GEDCOM」とも呼ばれ、元々InterGEDと呼ばれる)と呼ばれるバージョンを定義しました。 。それはイベントベースですが、証拠ではなく仮定された現実に基づいて構築されたモデルです。イベントGEDCOMは、信じられているイベントと参加者をある程度分離できるため、より柔軟でした。ただし、Event GEDCOMは、セマンティックの違いにより、他の開発者に広く採用されていませんでした。 RootsとUltimate Family Treeが利用できなくなったため、今日、Event GEDCOMを使用している人はほとんどいません。

Gramps XMLは、オープンソースの系図プロジェクトGrampsによって作成され、PhpGedViewでも使用されているXMLベースのオープン形式です。

家族歴史情報標準化機構は、家族歴史および家系情報の国際標準を開発することを目的として、2012年に設立されました。それらの標準の1つは、拡張レガシー形式(ELF)と呼ばれるGEDCOMの継続です。これは、GEDCOM 5.5(.1)との互換性から始まりますが、拡張メカニズムを含みます。これは、GEDCOMへの財政的コミットメントでソフトウェアを支援し、さらなる標準が進化するにつれてソフトウェアが取り残されるのを防ぐように設計されています。