فهرست و منابع پایان نامه استخراج اتوماتیک اطلاعات بر اساس آنتالوژی   
                                        فهرست:
فهرست لیست ها............................................................................................................................... و  ۱-  مقدمه ..........................................................................................................................................١ 
۱-۱-  وب معنایی......................................................................................................................................
۱-۲-  بازیابی و استخراج اطلاعات............................................................................................................
۱-۳-  محدوده بحث و دستاورد تحقیق ..................................................................................................... ٥ 
۱-۴-  طرح کلی بحث ............................................................................................................................... ٧ 
۲-  مفاهیم و کلیات ...........................................................................................................................٩ 
۲-۱-  معرفی آنتالوژی............................................................................................................................... ٩ 
۲–۱–۱– سطوح بازنمایی آنتالوژی.......................................................................................................................١١ 
۲–۱–۲– زبان های تعریف آنتالوژی.....................................................................................................................١٢ 
۲-۲-  استخراج اطلاعات و وب معنایی...................................................................................................١٤ 
۲-۳-  استخراج اطلاعات از انوع مختلف منابع متنی وب ........................................................................١٦ 
۲-۴-  بازیابی اطلاعات و استخراج اطلاعات...........................................................................................١٧ 
۲- ۴-۱-  "بازیابی داده" در مقابل "بازیابی اطلاعات"...............................................................................................١٩ 
۲- ۴-۲-  "بازیابی اطلاعات برای وب معنایی" در مقابل "بازیابی اطلاعات مبتنی بر آنتالوژی"...................................٢٠ 
۲-۵-  ایجاد آنتالوژی برای وب معنایی....................................................................................................٢٠ 
۲- ۵-۱-  ایجاد دستی آنتالوژی ها..........................................................................................................................٢٠ 
۲- ۵-۲-  ایجاد اتوماتیک آنتالوژی ها.....................................................................................................................٢٢ 
۲-۶-  خلاصه مطالب و نتیجه گیری........................................................................................................٢٤ 
۳-  بررسی سوابق مرتبط با تحقیق .................................................................................................. ٢٥ 
۳-۱-  مقدمه ............................................................................................................................................٢٥ 
۳-۲-  روش های مبتنی بر زبان های پرس و جو .....................................................................................٢٦ 
۳-۳-  روش های مبتنی بر پردازش زبان طبیعی.......................................................................................٢٩ 
أ
۳-۴-  روش های آگاه از HTML............................................................................................................٣٥ 
۳-۵-  روش های استنتاج WRAPPER.....................................................................................................٣٨ 
۳-۶-  روش های مبتنی بر آنتالوژی .........................................................................................................٤٢ 
۳-۷-  خلاصه مطالب و نتیجه گیری........................................................................................................٤٦ 
  ٤٨ ............................................................................................ONTOBYONTO معرفی سیستم  -۴
۴-۱-  مقدمه ............................................................................................................................................٤٨ 
۴-۲-  معماری سیستم ONTOBYONTO.................................................................................................٥٠ 
  ٥٢...............................................................................................WRAPPER زبان تعریف :WDML  -۳-۴
۴- ۳-۱-  معرفی مستندات ورودی.........................................................................................................................٥٣ 
۴- ۳-۲-  معرفی قالب خروجی.............................................................................................................................٥٤ 
۴- ۳-۳-  معرفی الگوی استخراج...........................................................................................................................٥٥ 
۴-۴-  استخراج با استفاده از WDML.....................................................................................................٦٢ 
۴- ۴-۱-  الگوریتم استخراج..................................................................................................................................٦٢ 
۴- ۴-۲-  اجرای یک مثال......................................................................................................................................٦٦ 
۴-۵-  خلاصه مطالب و نتیجه گیری........................................................................................................٦٨ 
۵-  تولید اتوماتیک فایل های WDML........................................................................................... ٧٠ 
۵-۱-  مقدمه ............................................................................................................................................٧٠ 
۵-۲-  آنتالوژی استخراج .........................................................................................................................٧١ 
۵- ۲-۱-  انتخاب زبان...........................................................................................................................................٧٢ 
۵- ۲-۲-  تعریف کلاس ها....................................................................................................................................٧٣ 
۵- ۲-۳-  تعریف خصوصیات................................................................................................................................٧٤ 
۵- ۲-۴-  تعریف الگو ها.......................................................................................................................................٧٧ 
۵- ۲-۵-  تعریف فهرست واژگان آنتالوژی.............................................................................................................٨١ 
۵- ۲-۵-  آنتالوژی استخراج برای یک صفحه وب نمونه.........................................................................................٨٢ 
۵-۳-  الگوریتم ایجاد اتوماتیک WDML................................................................................................٨٤ 
۵- ۳-۱-  تولید WDML........................................................................................................................................٨٥ 
  ٨٧.......................................................................................................................................Wapper ایجاد  -۲-۳ -۵
۵- ۳-۳-  یافتن الگو ها..........................................................................................................................................٨٩ 
۵- ۳-۴-  روتین های اولیه مورد نیاز در پردازش الگو ها........................................................................................٩٣ 
۵-۴-  اجرای الگوریتم در یک صفحه نمونه ..........................................................................................١٠٢ 
۵-۵-  خلاصه مطالب و نتیجه گیری......................................................................................................١٠٦ 
ب 
۶-  ارزیابی و جمع بندی مطالب ................................................................................................... ١٠٧ 
۶-۱-  مقدمه ..........................................................................................................................................١٠٧ 
۶-۲-  شاخص های ارزیابی...................................................................................................................١٠٨ 
۶-۳-  روش و نتایج ارزیابی ..................................................................................................................١١٠ 
۶-۴-  نقاط گسترش تحقیق...................................................................................................................١١٢ 
۷-  منابع ....................................................................................................................................... ١١٣ 
۸-  ضمائم .................................................................................................................................... ١١٦ 
۸-۱-  آنتالوژی استخراج نمونه برای گوش های تلفن همراه .................................................................١١٦
منبع:
 
[ISC06] Internet Software Consortium, Last Visited: 05/05/2007, www.isc.org, Jannuary 2006
 [Lee01] Berners-Lee, T, Hendler, J & Lassila, O, 2001. "The semantic web", Scientific American.
[Dac03] Michael C. Daconta, Leo J. Obrst, Kevin T. Smith, 2003. "The Semantic Web: A Guide to the Future of XML, Web Services  and Knowledge Management", Wiley publishing.
[Dav03] John Davies, Dieter Fensel, and Frank van Harmelen, editors. "Towards the Semantic Web: Ontology-Driven Knowledge Management". John Wiley & Sons, 2003.
[Bro01] Broekstra, J. and Kampman, A., 2001. "Sesame: A generic Architecture for Storing and Querying RDF and RDF Schema". Deliverable 10, On-To-Knowledge project, October. http://www.ontoknowledge.org/downl/del10.pdf
[Wes05] Wessman, A., Liddle, S.W., Embley, D.W., “A generalized framework for an ontology-based data-extraction system”. In Proc. 4th Int. Conference on Information Systems Technology and its Applications, 239-253, 2005.
[Sha01] Shah, U., T. Finin, J. Mayfield. “Information retrieval on the Semantic Web” In Proceedings of the Eleventh International Conference on Information and Knowledge Management, McLean, Virginia, 4-9 November 2002, pp. 461-468.
[Sim05] Simon, K., and Lausen, G. 2005. "ViPER: augmenting automatic information extraction with visual perceptions". In Proc. CIKM'05, 381--388. ACM.
[Sno02] Snoussi H., Magnin L. and Nie J.-Y, "Toward an Ontology-based Web Data Extraction", The AI-2002 Workshop on Business Agents and the Semantic Web (BASeWEB) held at the AI 2002 Conference (AI-2002), Calgary, Alberta, Canada, May 26, 2002.
 [Eng02-6] Robert Engels, 2002. "CORPORUM-OntoExtract: Extraction of structured information from web based resources", OnToKnowledge Project Report, Delivery
6.
[Eng02-7] Robert Engels, 2002. "CORPORUM-OntoWrapper: Extraction of structured information from web based resources", OnToKnowledge Project Report, Delivery
7.
[Onto07] The Onto-Knowledge Toolset, Last Visited: 05/05/2007, http://www.ontoknowledge.org/tools/toolrep.shtml. 
 [KIM07] KIM Online reference, Last Visited: 05/05/2007, http://www.ontotext.com
[Lae02] Laender, A., Ribeiro-Neto, B., Silva, A. and Teixeira, J. "A Brief Survey of Web Data Extraction Tools", in: SIGMOD Record, Volume 31, Number 2, June 2002.
[Bar05] Bartlett W., "A Comparison of Techniques for Exposing Legacy Data to Semantic Web Technologies", In Proc. 21st Annual Computer Science Conference, 2005.
 [SEA07] SESAME Online Open Source, Last Visited: 05/05/2007, http://www.openrdf.org/documentation.jsp.
۱۱۳
[Pop03] B. Popov, A. Kiryakov, D. Ognyanoff, D. Manov, A. Kirilov, M. Goranov, "Towards Semantic Web Information Extraction", Human Language Technologies Workshop at the 2nd International Semantic Web Conference (ISWC2003), Florida, USA, 2003.
[Cun02] Cunningham H., Maynard D., Bontcheva K. and Tablan V., "GATE: A Framework,
Graphical Development Environment for Robust NLP Tools and Applications". In Proc. of the 40th Anniversary Meeting of the Association for Computational Linguistics, 2002.
[Luc07] Lucene - high performance full text search engine, Last Visited: 05/05/2007.
http://jakarta.apache.org/lucene.
[Fro97] Frohn, J., Himmer¨oder, R., Kandzia, P.T., Lausen, G., Schlepphorst, C., "FLORID: A Prototype for F-Logic", In: ICDE’97, IEEE Computer Society (1997) 583.
[FL07] “How to Write F-Logic Programs,” Online. Internet. Last Visited: 05/05/2007, http://ontoprise.de/documents/tutorial_flogic.pdf
[Aro98] Arocena, G., Mendelzon, A., "WebOQL: Restructuring Documents, Databases and Webs", Proceedings of International Conference on Data Eengineering, 1998.
[Sah00] A. Sahuguet and F. Azavant. "Building Intelligent Web Applications Using Lightweight Wrappers". to appear in: Data and Knowledge Engineering, 2000.
[Hmn06] Thomas Hornung, Kai Simon, Georg Lausen, "Information Gathering in a Dynamic World". PPSWR 2006: 237-241, Principles and Practice of Semantic Web Reasoning, 4th International Workshop, PPSWR 2006, Budva, Montenegro, June 1011, 2006, Revised Selected Papers.
 [Chr07] Christopher D. Manning, P. Raghavan, H. Schütze."An Introduction to Information to Information Retrieval", Cambridge University Press, 2007.
[Wtn00] Ian H. Witten, Eibe Frank, “Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations”, Morgan Kaufman Publishers, 1-55860552-5, 2000.
[Ksl00] Kosala R., Blockeel H. “Web Mining Research: A Survey”, SIGKDD Explorations, July 2000.
[Baz99] Baeza-Yates, R. & Ribeiro-Neto, B. "Modern Information Retrieval", Addison Wesley, 1999.
[Arp03] Arpirez J. C., Corcho O., Fernandez-Lopez M., and Gomez-Perez A. "Webode in a nutshell". AI Magazine, 24(3):37-47, 2003
[Ksh00] Kushmerick, N. 2000. "Wrapper induction: Efficiency and expressiveness". Artificial Intelligence J. 118(1-2):15-68 (special issue on Intelligent Internet Systems).
[Crs05] M. Cristani, R. Cuel, “A Survey on Ontology Creation Methodologies”,
International Journal on Semantic Web and Information Systems, Vol. 1, No. 2, 49 – 69, 2005
[Emb98] D.W. Embley. "Toward semantic understanding - an approach based on information extraction ontologies". In Proceedings of the the Fifteenth Australasian Database Conference, Dunedin, New Zealand, January 2004.
[Eik99] Line Eikvil. "Information Extraction from World Wide Web - A Survey". Technical Report 945, Norweigan Computing Center, 1999.
۱۱۴
[Hau03] Y. Qi, A. Hauptmann, and T. Liu: “Supervised classification for video shot segmentation” in Proc. IEEE Conf. Multimedia Expo (ICME03) vol. 2, 2003, pp. 689-692.