Динамические DOM-объекты - линвистическое и алгоритмическое обеспечение источников данных в ситуационно-ориентированных базах данных

Юрий Борисович Головкин, Валерий Викторович Миронов, Артем Сергеевич Гусаренко

Аннотация


Работа решает задачу разработки алгоритмического обеспечения ситуационно-ориентированных баз данных, для обработки источников данных различного объема требуются алгоритмы для реализации методов обработки XML-документов в СОБД. Демонстрируется общий случай обработки, очистки и фильтрации документа XML, реализованные в интерпретаторе. Предложены два подхода к обработке XML, первый - потоковая обработка, а второй - кэшированная обработка с загрузкой документа в оперативную память. В модель встроены DOM-элементы, привязанные к состояниям динамической модели, в которые введены атрибуты специфицирующие обработку и загрузку XML-данных. Введены термы обработки данных для разработанных алгоритмов. Разработан алгоритм - головной интерпретации DOM-элемента, для обработки модели DOM-элементов. Разработан алгоритм интерпретации элементов-источников, для обработки вложенных элементов источников внутри DOM-элементов. Разработан алгоритм потоковой обработки DOM-объектов, т. е. с использования инструмента XMLReader. Разработан алгоритм кэшированной обработки DOM-объектов для использования технологии DOM. Для данного вида обеспечения разработаны модули интерпретатора на платформе PHP. В статье приведено представление модели разработанной для обработки источников СОБД. Это представление - текст XML для использования в информационной системе. Данная модель реализует пример со студентами сдачами и предметами, когда по запросу студента выдаются все предметы и оценки выбранного студента, или, наоборот, по выбранному предмету выводятся все студенты с их оценками. Для обработки файлов Student.xml, Subject.xml, Acadach.xml используются методы кэшированной обработки, когда документ не загружается в память целиком, а направляется в поток, где он просматривается по каждому элементу в отдельности до поиска нужного, при таком подходе возврат к пройденным элементам невозможен, для возврата требуется заново направлять его в поток. Такой подход помогает обрабатывать документы большого объема. Второй подход - кэшированная обработка с загрузкой документа целиком, этот метод более удобен для небольших документов и возврат к предыдущим узлам документ возможен.


Полный текст:

PDF (English) (English)

Литература


Gusarenko, A. S. (2012). Infrastructure situationally-oriented databases based on dynamic DOM-objects (Vol. 1, pp. 58–62). Presented at the Information and Communication Technologies: Proceedings of the 7th Russian Winters Workshop graduate students and young scientists, Ufa: USATU.

Gusarenko, A. S., & Mironov, V. V. (2013). Profiling algorithm of situationally-oriented database based on dynamic DOM-objects (Vol. 1, pp. 115–118). Presented at the Proc. 8th Workshop of winter school postgraduates and young researchers, Ufa: USATU.

Strauch, C., & Kriha, W. (n.d.). NoSQL databases. Retrieved from http://www.christof-strauch.de/nosqldbs.pdf

Gusarenko, A. S. (2013). Handling XML-documents in situationally-oriented databases based on dynamic DOM-objects (thesis abstract). Ufa State Aviation Technical University, Ufa.

Gusarenko, A. S., & Mironov, V. V. (2013). Algorithmic and linguistic support of situationally-oriented databases based on dynamic DOM-objects (Vol. 1, pp. 119–122). Presented at the Proc. 8th Workshop of winter school postgraduates and young researchers, Ufa: USATU.

Mironov, V. V., & Gusarenko, A. S. (2013). Profiling algorithm of situationally-oriented database based on dynamic DOM-objects (Vol. 1, pp. 115–118). Presented at the Proc. 8th Workshop of winter school postgraduates and young researchers, Ufa, Russia: USATU.

He, W., & Zhai, J. (2013). Application of the indent conversion based on XML and DOM (Vol. 1, pp. 411–413). Presented at the Proceedings - 2013 International Conference on Computational and Information Sciences (ICCIS’ 2013).

Han, W. (2014). Leveraging spatial join for robust tuple extraction from web pages (Vol. 261, pp. 132–148). Presented at the Information Sciences.

Pokorný, J. (2013). New database architectures: Steps towards big data processing (pp. 3–10). Presented at the Proceedings of the IADIS International Conference Intelligent Systems and Agents 2013 ECDM’ 2013, Prague, Czech Republic.

Kaur, K., & Rani, R. (2013). Modeling and querying data in NoSQL databases (pp. 1–7). Presented at the Proc. of IEEE International Conference on Big Data 2013, Santa Clara, CA, United States.

Benzaken, V. (2013). Static and dynamic semantics of NoSQL languages (pp. 101–113). Presented at the 40th Annual ACM SIGPLAN-SIGACT Symposium on Principles of Programming Languages POPL’ 2013, Rome, Italy.

Takahashi, K. (2013). Design and evaluation of lifelog mashup platform with NoSQL database (pp. 133–139). Presented at the Proc. of 15th International Conference on Information Integration and Web-Based Applications and Services, iiWAS’2013, Vienna, Austria.

Case, P. (2006). Enhancing XML search with XQuery 1.0 and XPath 2.0 full-text. Ibm Systems Journal, 45(2), 353–360.

O’Connor, B. D., Merriman, B., & Nelson, S. F. (2010). SeqWare Query Engine: storing and searching sequence data in the cloud. Bmc Bioinformatics, 11, 9.

Batory, D. (2006). Multilevel models in model-driven engineering, product lines, and metaprogramming. Ibm Systems Journal, 45(3), 527–539.

Chen, Y. J., & Huck, G. (2001). On the evaluation of path-oriented queries in document databases. Database and Expert Systems Applications, 2113, 953–962.

Dekeyser, S., Hidders, J., & Paredaens, J. (2004). A transaction model for XML databases. World Wide Web-Internet and Web Information Systems, 7(1), 29–57.

Herskovits, E. H., & Chen, R. (2008). Integrating Data-Mining Support into a Brain-Image Database Using Open-Source Components. Advances in Medical Sciences, 53(2), 172–181.

Jea, K. F., Chang, T. P., & Chen, S. Y. (2009). A Semantic-Based Protocol for Concurrency Control in DOM Database Systems. Journal of Information Science and Engineering, 25(5), 1617–1639.

Kudrass, T., & Conrad, M. (2002). Management of XML documents in object-relational databases (Vol. 2490, pp. 210–227). Presented at the Xml-Based Data Management and Multimedia Engineering-Edbt 2002 Workshops.

Nassis, V., Dillon, T. S., Rajagopalapillai, R., & Rahayu, W. (2006). An XML Document Warehouse model (Vol. 3882, pp. 513–529). Presented at the Database Systems for Advanced Applications, Proceedings.

Sladic, G., Milosavljevic, B., Konjovic, Z., & Vidakovic, M. (2011). Access Control Framework for XML Document Collections. Computer Science and Information Systems, 8(3), 591–609.

Sudarsan, R., & Gray, J. (2006). Metamodel search: Using XPath to search domain-specific models. Journal of Research and Practice in Information Technology, 38(4), 337–351.

Tang, N., Yu, J. X., Wong, K. F., & Li, J. X. (2008). Fast XML structural join algo-rithms by partitioning. Journal of Research and Practice in Information Technology, 40(1), 33–53.

Dejanovic, I., Milosavljevic, G., Perisic, B., & Tumbas, M. A. (2010). Domain-Specific Language for Defining Static Structure of Database Applications. Computer Science and Information Systems, 7(3), 409–440.

Su-Cheng, H., & Lee, C. S. (2009). Efficient Preprocesses for Fast Storage and Query Retrieval in Native XML Database. Iete Technical Review, 26(1), 28–40.

Panach, J. I., Juristo, N., & Pastor, O. (2013). Including Functional Usability Features in a Model-Driven Development Method. Computer Science and Information Systems, 10(3), 999–1024.

Rose, K. H., Malaika, S., & Schloss, R. J. (2006). Virtual XML: A toolbox and use cases for the XML world view. Ibm Systems Journal, 45(2), 411–424.


Ссылки

  • На текущий момент ссылки отсутствуют.




Лицензия Creative Commons
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.