State-of-the-art: Ce inseamna indexarea video si care sunt realizarile actuale in

aceasta directie ?

1. Problematica generala a indexarii dupa continut.

 

Procesul de indexare consta in adnotarea datelor in functie de continutul acestora. Aceasta etapa este indispensabila pentru a putea accesa baze/colectii semnificative de date. Intr-o astfel de baza, o anumita data care nu a fost indexata este practic invizibila pentru utilizator datorita faptului ca nu exista nici o informatie cu privire la existenta sa. Un exemplu simplu de indexare este insasi sistemul de fisiere folosit de orice sistem de operare. Acesta propune indexarea dupa nume, extensie, data, etc. Sa ne imaginam ca in programul de explorare un document nu a fost indexat, cu toate ca el se afla pe dispozitivul de stocare acesta nu va fi vizibil decat prin accesul de nivel scazut la datele sistemului.

 

Cu toate ca procesul de adnotare consituie baza unui sistem de indexare, acesta nu este suficient. Utilizatorul trebuie sa dispuna de solutii software care sa ii permita interactia cu datele pe baza unei interfete grafice ergonomice si agreabile ce va raspunde in mare la doua necesitati: de navigare si de cautare (vezi Figura 1.1).

 

                      

Figura 1.1: Structura generala a unui sistem de indexare.

 

In sistemul de navigare utilizatorul poate vizualiza continutul datelor, fie direct din baza de date fie prin intermediul unor rezumate (mai ales in cazul datelor ce necesita un timp ridicat pentru vizualizare precum secventele video).

Pe de alta parte, sistemul de cautare, deseori parte integranta a celui de navigatie, va permite utilizatorului cautarea datelor pe baza formularii de cereri de cautare („query”). Principiul de functionare al unui astfel de sistem este urmatorul :

 

a. datele din baza sunt prelucrate („offline”) pentru a fi adnotate. Indexii asociati sunt de regula masuri numerice sau simbolice legate de continutul acestora. In paralel cu aceata etapa, in functie de datele analizate, se poate realiza constructia de rezumate (de exemplu imaginile de tip „thumbnails” asociate fisierelor video in Windows).

 

b. navigarea in baza (sau „rasfoirea” acesteia) se face pe baza interfetei grafice special dezvoltate si folosind rezumatele datelor calculate in etapa precedenta, sau in functie de optiunea utilizatorului, accesul se poate face direct la continutul de date.

 

c. cautarea are ca scop gasirea datelor cerute de utilizator. Pentru aceasta se foloseste o cerere de cautare („query”) ce este tradusa ulterior de sistem in indexi de cautare similari celor generati in prima etapa. Cautarea propriu-zisa este efectuata apoi prin analiza similaritatii intre indexii de cautare si cei deja existenti in baza de date. Datele din baza cele mai apropiate de criteriile de cautare sunt propuse utilizatorului ca rezultat al cautarii. Pentru a ameliora performantele sistemului, utilizatorul isi poate exprima gradul de satisfactie fata de rezultatele obtinute („feedback”) astfel sistemul invatand sa-si adapteze algoritmul de cautare la cerintele utilizatorului.

 

Volumul mare de baze de date multimedia existente a dat nastere la necesitatea dezvoltarii de sisteme de indexare dupa continut pentru fiecare categorie de date.

 

Astfel putem mentiona cele mai utilizate : sistemele de indexare a imaginilor Content-Based Image Retrieval (de exemplu : indexare de imagini medicale, fotografii, tablouri etc.) [Smeulders 00], sistemele de indexare video Content-Based Video Retrieval (de exemplu : indexare de secvente de stiri, secvente sportive, filme, videoclipuri, etc.) [Naphade 02] si sistemele de indexare audio Content-Based Audio Retrieval (de exemplu indexare de muzica, dialog, etc.) [Wang 00].

Content-Based Semantic Retrieval of Video Documents, Application to Navigation, Research and Automatic Content Abstraction.

 

 CNCSIS project RP-2