اصطلاحنامه در نظام ذخيره و بازيابى اطلاعات(1)

نوشته: مهرانگيز حريرى

نظام بازيابي اطلاعات, نظامي است كه هدفش تسهيل شناسايي مدارك يا داده هايي است كه متناسب با نياز اطلاعاتي خاصي باشد و بازيابي اين مدارك با داده ها با توجه به محدوديت موادي كه در مجموعه موجود است.

بازيابي اطلاعات يك عمل ساده و مكانيكي نيست؛ كاري است پيچيده و فكري كه منظور آن ايجاد ارتباط ميان كساني است كه اين اطلاعات را توليد مي كنند (نويسندگان مطالب) و افرادي كه اين اطلاعات را مصرف مي‌كنند (محققان, متخصصان و ساير دانش پژوهان ). بنابراين، نقش عمده نظام برقرار كردن اين ارتباط از طريق مطابقت اطلاعات موجود در مجموعه با نياز اطلاعاتي استفاده كنندگان و نزديك كردن هر چه بيشتر اين دو به يكديگر است.

براي اينكه نظام قادر به انجام اين عمل باشد. بايد محتواي مجموعه كاملاً مشخص باشد, يعني مدارك از لحاظ محتوا بدقت توصيف شده باشند. اما اين به تنهايي كافي نيست, بلكه بايد نياز جستجو كننده اطلاعات هم بشكلي به نظام عرضه شود كه عمل انطباق بين مدارك ذخيره شده و پرسش مطرح شده را تسريع كند. معمولاً اين كار بوسيله استفاده از نوعي زبان نمايه انجام ميگيرد.

زبان نمايه يكي از اجزاي عمده نظام ذخيره و بازيابي اطلاعات محسوب مي شود. هر نظام اطلاعاتي از نقطه نظر عملكرد, معمولاً شامل اجزاي زير است:

1) انتخاب گردآوري: سياست و خط مشي تعيين كننده محتواي مجموعه.

2) مأخذ درون داد: ويژگيهايي از مدرك براي توصيف آن و براي انتخاب اصطلاحات نمايه بكار مي رود.

3) زبان نمايه: مجموعه اصطلاحات و قوانيني كه نحوه استفاده از اصطلاحات را تعيين مي كند.

4) نشانه گذاري: عرصه اصطلاحات نمايه به صورت علائم و نشانه ها.

5) نظم مجموعه: ترتيب و نظم عناصر در درون مجموعه اطلاعات ذخيره شده.

6) تجزيه و تحليل پرسش: ترجمه مفاهيم پرسش به اصطلاحات موجود در زبان نمايه.

7) شيوه جستجو: روشي كه براي جستجوي در مجموعه بكار مي رود.

8) شكل برون داد: عرضه مشخصات ظاهري مدرك و اطلاعات لازم ديگر كه بعنوان پاسخ به پرسش مطرح شده در اختيار جستجو كننده گذاشته مي شود.

هر يك از اجزاي فوق در ايجاد نظام ذخيره و بازيابي اطلاعات و كارآيي آن نقش اساسي و مهمي دارد. در اين ميان، آنچه بسبب پيچيدگيش ذهن متخصصان اطلاع رساني را بيشتر به خود مشغول داشته است نشان دادن محتواي مدارك است و به اين جهت شايد بتوان گفت زبان نمايه كه براي بيان موضوع و محتواي مدارك بكار مي‌رود. مساله اي است كه اهميت بيشتري دارد.

زبانهاي نمايه را بر اساس معيارهاي متفاوت. به گونه هاي مختلف دسته بندي كرده اند ولي بطور كلي مي‌توان گفت كه اين زبانها عمدتاً بر دو نوعند:

1. زبانهاي مهار شده : اين زبانها، حاوي اصطلاحاتي هستند كه براي نمايه سازي مدارك انتخاب و پذيرفته شده‌اند و از آن جمله اند: طرحهاي رده بندي سنتي، فهرستهاي قراردادي سر عنوانهاي موضوعي و اصطلاحنامه ها.

2. زبانهاي آزاد : در اين زبانها، محدوديتي از نظر نوع واژه وجود ندارد؛ هر واژه با اصطلاح مناسبي مي‌تواند بدون قيد و شرط از زبان طبيعي گرفته شود، يعني عيناً از زبان مدرك نقل گردد و يا متناسب با موضوع مدرك تعيين شود.

اينكه كداميك از دو روش فوق در ميزان بازيابي مدارك و كيفيت كار موثرتر است، نكته اي است كه هنوز بدرستي روشن نيست و اختلاف نظرهايي كه در ميان اهل فن وجود دارد مويد اين مطلب است. اما آنچه در عمل مشاهده مي شود اين است كه اكثر نظامهاي داير و فعال اطلاع رساني كه خدمات گسترده اي را عرضه مي كنند، از زبان مهار شده براي آماده سازي مدارك خويش استفاده مي كنند و ابزاري كه بدين منظور بكار مي رود اصطلاحنامه است. بدين جهت، مطلب حاضر به بحث درباره اين وسيله اختصاص يافته است.

تعريف اصطلاحنامه

اصطلاحنامه، واژه اي است كه در فارسي معادل واژه انگليسي Thesaurus بكار رفته است. واژه Thesaurus در اصل از يوناني و لاتين گرفته شده كه بمعناي گنجينه يا خزانه است و سالهاست كه بمعناي گنجينه لغات استفاده مي گردد.

بر اساس رهنمود نظام جهاني اطلاعات علمي (يوني سيست) اصطلاحنامه را مي توان يا از نظر عملكردش تعريف كرد و يا از عملكردش تعريف كرد و يا از لحاظ ساختارش. از نظر عملكرد، اصطلاحنامه وسيله اي براي مهار كردن واژه ها است و در برگرداندن زبان طبيعي مدارك، نمايه سازان يا استفاده كنندگان به زبان مقيد نظام استفاده مي‌شود. از نظر ساختار، اصطلاحنامه مجموعه لغات مهار شده و پوياي يك زمينه خاص از دانش بشري است كه از لحاظ معنا و نوع مرتبط اند.

پيشينه تاريخي

اولين اثري كه تحت عنوان اصطلاحنامه شهرت يافت، اصطلاحنامه روژه بود . اين اصطلاحنامه كه اولين ويرايش آن در 1852 بچاپ رسيد و هنوز هم ويرايشهاي جديد آن منبع معتبري براي نويسندگان و مترجمان است، يك فرهنگ ساده لغات نيست و با آن تفاوت بسيار دارد. زيرا معمولاً وقتي به يك فرهنگ مراجعه مي‌كنيم كه واژه اي را مي دانيم و به دنبال معناي آن مي گرديم. اما از اين اصطلاحنامه موقعي استفاده مي‌شود كه فكر و عقيده اي را در سر داريم و در جستجوي كلمه يا عبارت دقيق و مناسب براي بيان آن هستيم. به اين جهت برخلاف فرهنگها، تنظيم آن الفبايي نيست بلكه بر اساس افكار و ايده هاست كه در گروههاي كلي نظير زمان، مكان، ماده، حواس، اراده، عواطف. . . دسته بندي شده اند. هر گروه شامل تقسيمات فرعي تري است كه هر يك از آنها به نوبه خود چندين كلمه يا عبارت را در برمي گيرد. در زير هر كلمه، تمام كلمات مترادف و عبارات وابسته به آن مفهوم و شكلهاي مختلف دستوري آنها ذكر مي شود و ارتباط بين كلمات با ارجاعهاي لازم مشخص مي گردد. به اين ترتيب اصطلاحنامه روژه در واقع يك طرح رده‌بندي اصطلاحات است كه فهرستي الفبايي نيز بدنبال دارد و ارزش آن در نحوه ارتباط دادن مفاهيم بيكديگر با توجه به معاني متفاوت آنهاست.

البته قصد تهيه كننده اين اصطلاحنامه، استفاده از آن در ذخيره و بازيابي اطلاعات نبود بلكه كمك به كساني بود كه براي تصنيف متن يا متوني بدنبال اصطلاحات صحيح و مناسب براي بيان فكر و انديشه خود بودند. ضمناً اين نكته را هم بايد اضافه كرد كه تنظيم واژگان براساس مفاهيم، فكر تازه اي نبود كه از روژه سرچشمه گرفته باشد قبل از اين تاريخ هم، چنين انديشه اي بشكلها و مضمونهاي مختلف و براي هدفهاي متفاوت تجلي كرده بود و به جرات مي توان گفت كه بحثهاي كنوني در مورد ماهيت اصطلاحنامه و اصطلاحنامه‌سازي ريشه تاريخي دارد. اما اهميت اصطلاحنامه روژه در اين است كه ساخت ويژه آن چارچوب مطلوبي را براي طرحريزي اصطلاحنامه امروزي، در اختيار متخصصان اطلاع رساني گذاشته است.

نياز به اصطلاحنامه در ذخيره و بازيابي اطلاعات از زماني احساس شد كه نظامهاي اطلاع رساني با مشكلات مهمي در مرحله، جستجو و بازيابي اطلاعات مواجه گرديدند. زيرا اولاً رشد مداركي كه منتشر مي شد سير صعودي داشت و اين امر موجب افزايش سريع حجم اطلاعات كتابشناختي مي شد و از اين رو لازم بود بنحوه ذخيره آنها از نظر محتوا توجه بيشتري شود. ثانياً در روشهاي متداول نمايه سازي اكثراً از زبان طبيعي بويژه نظام تك واژه استفاده مي شد. نظام تك واژه كه در سال 1951 بوسيله مورتيمر تاوبه معرفي گرديد بعلت اينكه روشي ساده و ارزان در مرحله درون داد بود، ابتدا سخت مورد استقبال قرار گرفت اما مشكلات اساسي آن در مرحله جستجو خيلي زود آشكار شد، يكي از مشكلات عمده، ناشي از فقدان كنترل واژگاني بود. چون مدارك هم موضوع و مربوط بهم بعلت نمايه سازي با تك واژه هاي استخراج شده از متن، غالباً از هم جدا مي‌افتادند و بهنگام بازيابي نظام هيچ كمكي براي كنار هم آوردن اين كلمات نمي كرد و چنانچه جستجو در زير همه كلمات پيش بيني شده انجام مي گرفت. جستجو كننده باز هم نمي توانست مطمئن باشد كه جستجوي كاملي صورت گرفته است. مشكل ديگر جستجو در مجموعه اي بود كه مرتباً بر حجم آن افزوده مي شد و بهمان نسبت جستجوهاي جامع. مشكلتر مي شد. به لحاظ اين مسايل. بتدريج نمايه سازي با تك واژه حاوي خود را به نمايه سازي با تك مفهوم گزيده شده. داد و به اين ترتيب پايه و اساس ايجاد اصطلاحنامه بازيابي اطلاعات گذاشته شد.

اولين كسي كه در اين راه قدم برداشت هانس بيترلون بود. او تحت تاثير روش اصطلاحنامه روزه. در صدد برآمد كلمات مجاز همراه با ارجاعهاي لازم جهت استفاده در نمايه سازي موضوعي فراهم آورد . اولين اصطلاحنامه اي كه عملاً بدين منظور تهيه شد. براي نمايه سازي مدارك شيمي و مهندسي شيمي بوسيله كپماني Dupont بود. در همان اوان. كاربر روي اصطلاحنامه ديگري در آژانس اطلاعات فني خدمات نظامي در حال پيشرفت بود كه بالاخره در سال 1960 منجر به تهيه اصطلاحنامه اي شد كه حاوي توصيفگرهاي خاص اين زمينه بود. اين دو منبع كه سرچشمه توسعه ساير اصطلاحنامه ها شدند. موقعيت اصطلاحنامه را بعنوان ابزار اساسي كنترل واژگاني در نظامهاي ذخيره و بازيابي امروزي مستحكم كردند. اصطلاحنامه كمپاني Dupont پايه گذار اصطلاحنامه مهندسي شيمي شد كه توسط موسسه آمريكايي مهندسان شيمي در سال 1961 منتشر گرديد و اين نمونه خود. مبناي توسعه اصطلاحنامه واژه هاي مهندسي شد كه در سال 1964 بوسيله شوراي مشترك مهندسان انتشار يافت. توسعه صنايع. سبب پيدايش اصطلاحنامه هاي ديگري شد و تجاربي كه از گسترش اين اصطلاحنامه ها حاصل گرديد منجر به تدوين راهنماها و استانداردهاي ملي گرديد. بهرحال. تعداد اصطلاحنامه هايي كه از سال 1960 به بعد تهيه شده. قابل توجه است. اين اصطلاحنامه ها. اكثراً در رشته هاي علوم و فنون و به زبان انگليسي مي باشند.

هدف اصطلاحنامه

اصطلاحنامه بعنوان زبان نمايه سازي براي استفاده در ذخيره و بازيابي اطلاعات داراي هدفهاي اساسي و عمده زير است:

1) ساخت زمينه معيني از دانش را چنان تصوير نمايد كه هم نمايه ساز و هم جستجوگر بتوانند از پوشش زمينه و ارتباط ميان مفاهيم آن يا انديشه هاي مربوط به اين مفاهيم بخوبي آگاه شوند.

2) با عرضه واژگان استاندارد براي يك زمينه خاص. امكان يكدستي مدخلها را بهنگام نمايه سازي فراهم كند.3) بكمك نظام ارجاعات. دقيقاً مشخص كند كه اولاً از ميان مجموعه اصطلاحات برابر. فقط يك اصطلاح براي نمايه سازي يك مفهوم بكار مي رود و ثانياً كداميك از اصطلاحات بيكديگر وابسته هستند.

4) با استفاده از رده بندي اصطلاحات در قالب سلسله مراتب. امكان دهد بهنگام بازيابي دامه جستجو بصورت نظام يافته. قابل تجديد يا گسترش باشد.

همانطور كه ملاحظه مي شود. هدفهاي اصطلاحنامه بيشتر متوجه كار جستجو گرو استفاده كننده است و اين يكي از خصوصيات بارز اصطلاحنامه است.

ويژگيهاي مهم ا صطلاحنامه

با توجه به هدفهاي فوق. اصطلاحنامه بايد داراي ويژگيهاي زير باشد:

1) متكي بر نوشته ها و نيازهاي اطلاعاتي استفاده كنندگانه بالفعل و بالقوه نظام باشد.

بعبارت ديگر مبتني بر دو اصل ًضمانت ادبي ً و ً ضمانت استفاده ً باشد . ًضمانت ادبيً بدين معني است كه در تعيين موضوعها و ارتباط ميان آنها همانگونه عمل شود كه در مدارك مكتوب و مواد اطلاعاتي منعكس گرديده است. بنابر اين. اساس كار بايد مداركي باشد كه بعنوان درون داد به نظام وارد مي شوند نه ملاحظات نظري محض و تقسيم بنديهاي شناخته شده دانش. اين امر موجب مي شود كه نظام پويايي خود را هم حفظ كند. زيرا مفاهيم جديد بمحض ظاهر شدن در نوشته ها. وارد نظام مي گردند و بالطبع موجب تغييرات لازم در ساخت مفهومي زبان نظام مي شوند. ً ضمانت استفاده ً مربوط به برون داد نظام است. از آنجا كه هدف نظام. فراهم كردن امكان استفاده از اطلاعات است. لذا بايد ديد كه استفاده كنندگان نظام چه كساني هستند. بودن داد مورد نيازشان چيست. چه زباني علمي مورد استفاده آنهاست و اين زبان تا چه حد تخصصي است. سپس با توجه به اين موارد. موضوعها و نحوه تقسيم بندي آنها را در نظر گرفت.

بنابر اين يك اصطلاح در صورتي پذيرفته شده است كه اولاً نوشته هاي كافي در آن زمينه وجود داشته باشد و ثانياً مراجعان و استفاده كنندگان نظام در آن سطح از تخصص. بقدر كافي درخواست اطلاعات بكنند. در تهيه اصطلاحنامه ًضمانت استفاده ً حتي مهمتر از ًضمانت ادبي ً است. زيرا ممكن است در يك نظام. نام مثلاً انواع ماهيها. بر اساس محتواي مدارك. ضبط شده باشد كه در اين صورت ًضمانت ادبي ً رعايت شده است. اما اگر استفاده كنندگان اين نظام. هرگز به واژه اي ريزتر از ًماهيً احتياج نداشته باشد. گسترش واژگان با چنين دامنه اي در اين حد از تخصص . دليل منطقي و با ارزشي نخواهد داشت.

2) سطح شكستگي و خاص شدن اصطلاحات در حد كافي و مورد نياز باشد. اصطلاحات اخص در واژگان عامل مهم و موثري در دقت بازيابي هستند. براي مثال اگر جستجو كننده اي بدنبال مطلب درباره ًخودوسرً باشد ممكن است بعلت نبودن چنين اصطلاحي در نظام. مداركي را بازيابي كند كه با استفاده از اصطلاح عامتري چون ًغلات ً نمايه سازي شده اند. در اين صورت بسياري از مدارك بازيابي شده به موضوع مورد نظر مربوط نمي شوند.

3) پيش همآرايي غلط و ارتباط نادرست اصطلاحات در هنگام بازيابي جلوگيري شود. اين مشكلات بخصوص در نظامهاي تك واژه اي بيشتر بروز مي كند و به نسبتي كه بر پيش همآرايي اصطلاحات افزوده مي گردد. مشكلات مزبور كاهش مي يابد.

4) با اعمال كنترل واژگاني . يعني مهار كردن مترادفها. شبه مترادفها و نظاير آن . تعيين اصطلاحات مجاز و نيز مشخص كردن حدود ثغور اصطلاحاتي كه معنا و محدودشان روشن نيست موجب دقت و يكدستي در نمايه‌سازي و جستجو گردد و نمايه ساز و جستجو گر را در انتخاب مناسب ترين اصطلاح براي بيان موضوع خاصي كمك نمايد.

البته ويژگيهاي اصطلاحنامه به اين موارد محدود نمي شود. اما در تهيه و توسعه يك اصطلاحنامه خوب و كارآ. توجه به اين ويژگيها از اهميت خاصي برخوردار است.

اطلاع رسانى

نشريه فني مركز اطلاعات و مدارك علمي ايران

دوره ششم؛ شماره 1 و 2