- Španielsky jazyk
Extracción de datos de la web profunda basada en la visión para la agrupación de documentos web
Autor: M. Lavanya
El enfoque VDEC consta de dos fases: 1) Extracción de datos web basada en la visión, y 2) Agrupación de documentos web. En la fase 1, la información de la página web se segmenta en varios trozos, de los que se eliminan el ruido sobrante y los trozos duplicados... Viac o knihe
Na objednávku
73.98 €
bežná cena: 82.20 €
O knihe
El enfoque VDEC consta de dos fases: 1) Extracción de datos web basada en la visión, y 2) Agrupación de documentos web. En la fase 1, la información de la página web se segmenta en varios trozos, de los que se eliminan el ruido sobrante y los trozos duplicados utilizando tres parámetros, como el porcentaje de hipervínculos, la puntuación de ruido y la similitud del coseno. Para identificar los trozos relevantes, se utilizan tres parámetros, como la relevancia de la palabra del título, la selección de trozos basada en la frecuencia de las palabras clave y las características de posición, y luego se extrae un conjunto de palabras clave de esos trozos principales. Por último, las palabras clave extraídas se someten a la agrupación de documentos web mediante Fuzzy C-Means clustering (FCM). La propuesta de extracción de datos de la web profunda basada en la visión se implementa y se prueba utilizando un conjunto de datos sintéticos. Los resultados se comparan con los dos algoritmos existentes, uno de ellos es la extracción de registros de datos basada en la visión (ViDE) y otro es el algoritmo de minería de regiones de datos (MDR). A partir de los resultados experimentales que se han realizado en dos conjuntos de datos sintéticos diferentes, los resultados mostraron que el método VDEC propuesto puede lograr resultados estables y buenos de alrededor de 99,2% y 99,1% de valor de precisión en ambos conjuntos de datos con diferentes valores de umbral proporcionados.
- Vydavateľstvo: Ediciones Nuestro Conocimiento
- Rok vydania: 2022
- Formát: Paperback
- Rozmer: 220 x 150 mm
- Jazyk: Španielsky jazyk
- ISBN: 9786205023525