Skip to main content

Schema Matching คืออะไร?

การจับคู่สคีมาเป็นเทคนิคที่ใช้ในการผสานฐานข้อมูลที่ซับซ้อนสองฐานขึ้นไปหรือชุดข้อมูลเข้าด้วยกันเนื่องจากการใช้ฐานข้อมูลและการจัดเก็บข้อมูลอิเล็กทรอนิกส์จะเพิ่มขึ้นและซับซ้อนมากขึ้นผ่านอินเทอร์เน็ตจึงต้องมีวิธีการที่กำหนดไว้สำหรับการรวมชุดข้อมูลจากฐานข้อมูลหนึ่งไปยังอีกและการจับคู่สคีมาเป็นเทคนิคหนึ่งแนวคิดนั้นง่าย แต่ความเป็นจริงของการรวมข้อมูลนั้นค่อนข้างซับซ้อน

การจับคู่คำว่าสคีมาใช้คำพ้องกับการแมปสคีมาเพราะผู้ใช้กำลังทำแผนที่ข้อมูลจริงไม่ตรงกับพวกเขาฐานข้อมูลสองฐานขึ้นไปถูกแมปเข้าด้วยกันและด้านที่คล้ายกันของแต่ละฐานข้อมูลจะถูกแมปเข้าหากันวิธีที่พบบ่อยที่สุดในการรวมข้อมูลคือการใช้การอ้างอิงที่แน่นอนตัวอย่างของรูปแบบการรวมนี้คือการรวมคอลัมน์ชื่อของฐานข้อมูลหนึ่งกับคอลัมน์ชื่อของฐานข้อมูลอื่น

การรวมกันนั้นไม่ง่ายสำหรับคนหรือคอมพิวเตอร์ด้วยข้อมูลจำนวนมากที่จำเป็นต้องกรองรวมและใช้แล้วการมีฐานข้อมูลหนึ่งฐานข้อมูลมากกว่าฐานข้อมูลที่หลากหลายเป็นสิ่งจำเป็นการทำแผนที่ Schema มุ่งเน้นไปที่การทำให้กระบวนการที่น่าเบื่อนี้เป็นไปโดยอัตโนมัติและมีประสิทธิภาพมากขึ้นตัวอย่างที่จำเป็นต้องมีการจับคู่สคีมาอาจเป็นเมื่อฐานข้อมูลหนึ่งมีสาขาวิชาหลักของนักเรียนและฐานข้อมูลอื่นมีสาขาการศึกษาของนักเรียนมันเป็นข้อมูลเดียวกัน แต่ชื่อที่แตกต่างกันเล็กน้อยความพยายามที่จะผสมผสานความพยายามในการผสมผสาน

การจับคู่สคีมาจะแบ่งกระบวนการที่ซับซ้อนของการรวมฐานข้อมูลออกเป็นสี่ขั้นตอน: การรวมกันก่อนการเปรียบเทียบการปฏิบัติและการรวมก่อนที่จะสามารถรวมฐานข้อมูลหลายฐานข้อมูลได้พวกเขาจะต้องวิเคราะห์เพื่อความเหมือนและความแตกต่างในขอบเขตของการจับคู่สคีมาสิ่งนี้เรียกว่าก่อนการรวมเข้าด้วยกันคอมพิวเตอร์เริ่มกำหนดวิธีการรวมที่มีประสิทธิภาพมากที่สุด

ถัดไปคอมพิวเตอร์จะประเมินแผนการโดยการเปรียบเทียบกันในระดับที่มีรายละเอียดมากขึ้นในขั้นตอนการเปรียบเทียบคอมพิวเตอร์จะพิจารณารายการฐานข้อมูลแต่ละรายการและกำหนดว่าอาจมีความขัดแย้งที่ไหนตัวอย่างนี้คือเมื่อสนามสนใจของนักเรียนแสดงรายการแพทย์และฐานข้อมูลอื่นแสดงว่าเป็นแพทย์บุคคลน่าจะรับรู้ข้อมูลที่เหมือนกัน แต่สำหรับเครื่องมือฐานข้อมูลพวกเขาเป็นสองหน่วยงานที่แยกกัน

เมื่อคอมพิวเตอร์ได้กำหนดความขัดแย้งที่อาจเกิดขึ้นทั้งหมดมันสามารถก้าวไปข้างหน้าด้วยการพยายามแก้ไขปัญหานี่อาจเป็นเรื่องง่ายเหมือนการเปลี่ยนแปลงแพทย์ทุกกรณีเป็นแพทย์ในความเป็นจริงกระบวนการมีความซับซ้อนมากขึ้น

เมื่อความขัดแย้งทั้งหมดได้รับการแก้ไขแล้วคอมพิวเตอร์สามารถดำเนินการรวมข้อมูลในกระบวนการจับคู่สคีมาในขั้นตอนนี้ฐานข้อมูลสองฐานขึ้นไปจะถูกรวมเข้ากับฐานข้อมูลขนาดใหญ่หนึ่งฐานหากทุกอย่างเป็นไปด้วยดีจะไม่มีข้อขัดแย้งหรือข้อผิดพลาดเกิดขึ้นระหว่างการรวมและการเข้าถึงฐานข้อมูลในอนาคต