Logotipo de Zephyrnet

Indexe su contenido de Dropbox usando el conector de Dropbox para Amazon Kendra

Fecha:

amazona kendra es un servicio de búsqueda inteligente altamente preciso y fácil de usar impulsado por aprendizaje automático (ML). Amazon Kendra ofrece un conjunto de conectores de fuentes de datos para simplificar el proceso de ingesta e indexación de su contenido, dondequiera que resida.

Los datos valiosos en las organizaciones se almacenan en repositorios estructurados y no estructurados. Una solución de búsqueda empresarial debe poder reunir datos en varios repositorios estructurados y no estructurados para indexar y buscar.

Uno de esos repositorios de datos es Dropbox. Los usuarios empresariales usan Dropbox para cargar, transferir y almacenar documentos en la nube. Junto con la capacidad de almacenar documentos, Dropbox ofrece Dropbox Paper, una herramienta de coedición que permite a los usuarios colaborar y crear contenido en un solo lugar. Dropbox Paper puede usar plantillas opcionalmente para agregar estructura a los documentos. Además de archivos y papel, Dropbox también te permite almacenar accesos directos a páginas web en tus carpetas.

Nos complace anunciar que ahora puede utilizar el conector de Amazon Kendra para Dropbox para buscar información almacenada en su cuenta de Dropbox. En esta publicación, mostramos cómo indexar la información almacenada en Dropbox y usar la función de búsqueda inteligente de Amazon Kendra. Además, la búsqueda inteligente impulsada por ML de Amazon Kendra puede encontrar con precisión información de documentos no estructurados que tienen contenido narrativo en lenguaje natural, para los cuales la búsqueda de palabras clave no es muy efectiva.

Resumen de la solución

Con Amazon Kendra, puede configurar varias fuentes de datos para proporcionar un lugar central para buscar en su repositorio de documentos. Para nuestra solución, demostramos cómo indexar un repositorio o una carpeta de Dropbox mediante el conector de Amazon Kendra para Dropbox. La solución consta de los siguientes pasos:

  1. Configure una aplicación en Dropbox y obtenga los detalles de la conexión.
  2. Guarda los detalles en Director de secretos de AWS.
  3. Cree una fuente de datos de Dropbox a través de la consola de Amazon Kendra.
  4. Indexe los datos en el repositorio de Dropbox.
  5. Ejecute una consulta de muestra para obtener la información.

Requisitos previos

Para probar el conector de Amazon Kendra para Dropbox, necesita lo siguiente:

Configurar una aplicación de Dropbox y recopilar detalles de conexión

Antes de configurar la fuente de datos de Dropbox, necesitamos algunos detalles sobre su repositorio de Dropbox. Reunámoslos por adelantado.

  1. Ve a www.dropbox.com/desarrolladores.
  2. Elige consola de aplicaciones.
  3. Inicie sesión con sus credenciales (asegúrese de iniciar sesión en una cuenta Enterprise).
  4. Elige Crear aplicación.
  5. Seleccione Acceso delimitado.
  6. Seleccione Dropbox completo (o el nombre de la carpeta específica que desea indexar).
  7. Introduce un nombre para tu aplicación.
  8. Elige Crear aplicación.

    Puede ver la pantalla de configuración con un conjunto de pestañas.
  9. Para configurar los permisos, elija el Permisos .
  10. Seleccione un conjunto mínimo de permisos, como se muestra en las siguientes capturas de pantalla.
  11. Elige Enviar.

    Aparece un mensaje que dice que el cambio de permiso fue exitoso.
  12. En Ajustes pestaña, copie la clave de la aplicación.
  13. Elige Espectáculo al lado de App secreta y copiar el secreto.
  14. under Token de acceso generado, escoger Generar y copie el token.

Guarde estos valores en un lugar seguro; debemos consultarlos más adelante.

El token de sesión es válido hasta por 4 horas. Debe generar un nuevo token de sesión cada vez que indexe el contenido.

Almacenar las credenciales de Dropbox en Secrets Manager

Para almacenar sus credenciales de Dropbox en Secrets Manager, complete los siguientes pasos:

  1. En la consola de Secrets Manager, elija Almacenar un nuevo secreto.
  2. Elige Otro tipo de secreto.
  3. Cree tres pares clave-valor para appKey, appSecrety refreshToken e ingrese los valores guardados de Dropbox.
  4. Elige Guardar.
  5. Nombre secreto, ingrese un nombre (por ejemplo, AmazonKendra-dropbox-secret).
  6. Introduzca una descripción opcional.
  7. Elige Siguiente.
  8. En Configurar rotación sección, mantenga todas las configuraciones en sus valores predeterminados y elija Siguiente.
  9. En Revisar página, elige Tienda.

Configurar el conector de Amazon Kendra para Dropbox

Para configurar el conector de Amazon Kendra, complete los siguientes pasos:

  1. En la consola de Amazon Kendra, elija Crear un índice.
  2. Nombre del índice, introduzca un nombre para el índice (por ejemplo, my-dropbox-index).
  3. Introduzca una descripción opcional.
  4. Nombre de rol, introduzca un nombre de función de IAM.
  5. Configure los ajustes de cifrado y las etiquetas opcionales.
  6. Elige Siguiente.
  7. En Configurar el control de acceso de usuarios sección, deje la configuración en sus valores predeterminados y elija Siguiente.
  8. Ediciones de aprovisionamiento, seleccione Edición para desarrolladores.
  9. Elige Crear.

    Esto crea y propaga el rol de IAM y luego crea el índice de Amazon Kendra, lo que puede demorar hasta 30 minutos.
  10. Elige Fuentes de datos en el panel de navegación.
  11. under Dropbox, escoger Agregar conector.
  12. Nombre de fuente de datos, ingrese un nombre (por ejemplo, my-dropbox-connector).
  13. Introduzca una descripción opcional.
  14. Elige Siguiente.
  15. Tipo de token de autenticación, seleccione Token de acceso (uso temporal).
  16. Secreto de AWS Secrets Manager, elija el secreto que creó anteriormente.
  17. Rol de IAM, escoger Crear un nuevo rol.
  18. Nombre de rol, ingrese un nombre (por ejemplo, AmazonKendra-dropbox-role).
  19. Elige Siguiente.
  20. Seleccionar entidades o tipos de contenido, elige tus tipos de contenido.
  21. Frecuencia, escoger Ejecutar bajo demanda.
  22. Elige Siguiente.
  23. Establezca las asignaciones de campos opcionales y elija Siguiente.
  24. Elige Revisar y crear y elige Añadir fuente de datos.
  25. Elige Sincronizar ahora.
  26. Espere a que se complete la sincronización.

Prueba la solución

Ahora que ha ingerido el contenido de su cuenta de Dropbox en su índice de Amazon Kendra, puede probar algunas consultas.

Ve a tu índice y elige Buscar contenido indexado. Ingrese una consulta de búsqueda de muestra y pruebe sus resultados de búsqueda (su consulta variará según el contenido de su cuenta).

El conector de Dropbox también rastrea la información de identidad local de Dropbox. Para los usuarios, establece la identificación de correo electrónico del usuario como principal. Para grupos, establece la identificación del grupo como principal. Para filtrar los resultados de búsqueda por usuarios/grupos, vaya a Search Console.

Haga clic en "Consulta de prueba con nombre de usuario o grupos” para expandirlo y haga clic en el botón que dice “aplicar nombre de usuario o grupos.

Introduzca los nombres de usuario y/o grupo y haga clic en ¡Aplicá!. Luego, ingrese la consulta de búsqueda y presione enter. Esto le brinda un conjunto filtrado de resultados según sus criterios.

¡Felicidades! Ha utilizado con éxito Amazon Kendra para mostrar respuestas e información basada en el contenido indexado desde su cuenta de Dropbox.

Genere tokens permanentes para el acceso sin conexión

Las instrucciones de esta publicación lo guiarán a través de la creación, configuración y uso de un token de acceso temporal. Las aplicaciones también pueden obtener acceso a largo plazo solicitando acceso sin conexión, en cuyo caso la aplicación recibe un token de actualización que se puede usar para recuperar nuevos tokens de acceso de corta duración según sea necesario, sin más intervención manual del usuario. Puede encontrar más información en el Guía de OAuth de Dropbox y Documentación de autorización de Dropbox. Use los siguientes pasos para crear un token de actualización permanente (por ejemplo, para configurar la sincronización para que se active según un cronograma):

  1. Obtenga la clave de la aplicación y el secreto de la aplicación como antes.
  2. En un navegador nuevo, vaya a https://www.dropbox.com/oauth2/authorize?token_access_type=offline&response_type=code&client_id=.
  3. Acepte los valores predeterminados y elija Enviar.
  4. Elige Continúar.
  5. Elige Permitir.

    Se genera un código de acceso para usted.
  6. Copie el código de acceso.

    Ahora obtiene el token de actualización del código de acceso.
  7. En una ventana de terminal, ejecute el siguiente comando curl:
    curl https://api.dropbox.com/oauth2/token -d code= -d grant_type=authorization_code -u :

Puede almacenar este token de actualización junto con la clave de la aplicación y el secreto de la aplicación para configurar un token permanente en la configuración del origen de datos para Amazon Kendra. Amazon Kendra genera el token de acceso y lo usa según sea necesario para acceder.

Limitaciones

Esta solución tiene las siguientes limitaciones:

  • Los comentarios del archivo no se importan al índice
  • No tienes la opción de agregar metadatos personalizados para Dropbox
  • Los documentos, hojas y diapositivas de Google necesitan un espacio de trabajo de Google o una cuenta de Google y no están incluidos

Conclusión

Con el conector de Dropbox para Amazon Kendra, las organizaciones pueden acceder al repositorio de información almacenada en su cuenta de forma segura mediante la búsqueda inteligente con tecnología de Amazon Kendra.

En esta publicación, le presentamos los conceptos básicos, pero hay muchas características adicionales que no cubrimos. Por ejemplo:

  • Puede habilitar el control de acceso basado en el usuario para su índice de Amazon Kendra y restringir el acceso a los usuarios y grupos que configure
  • Puede especificar allowedUsersColumn y allowedGroupsColumn para que puedas aplicar controles de acceso basados ​​en usuarios y grupos, respectivamente
  • Puede asignar campos adicionales a los atributos de índice de Amazon Kendra y habilitarlos para facetar, buscar y mostrar en los resultados de búsqueda.
  • Puede integrar la fuente de datos de Dropbox con la capacidad de Enriquecimiento de documentos personalizados (CDE) en Amazon Kendra para realizar una lógica de mapeo de atributos adicional e incluso una transformación de contenido personalizado durante la ingesta.

Para obtener más información sobre estas posibilidades y más, consulte el Guía para desarrolladores de Amazon Kendra.


Acerca del autor.

Ashish Lagwankar es arquitecto sénior de soluciones empresariales en AWS. Sus principales intereses incluyen tecnologías de contenedores, AI/ML y sin servidor. Ashish vive en el área de Boston, MA, y disfruta leer, estar al aire libre y pasar tiempo con su familia.

punto_img

Información más reciente

punto_img

Habla con nosotros!

¡Hola! ¿Le puedo ayudar en algo?