Detenga la pérdida de datos en BigQuery con las nuevas copias de seguridad atómicas de HYCU
Durante años, HYCU ha sido la solución de protección de datos más completa para cargas de trabajo de Google Cloud. HYCU protege más servicios de Google Cloud que cualquier otra solución o servicio de copia de seguridad. En reconocimiento a esta innovación de larga data para los usuarios de Google Cloud, Google nombró a HYCU el Socio del Año de Google Cloud para Backup y DR en Google Cloud Next 24 en Las Vegas por su compromiso continuo para elevar el listón de la resistencia y recuperación de las joyas de la corona de los clientes, sus datos.
Google Cloud suele llamarse cariñosamente "La nube de datos", por su cartera de datos extremadamente robusta. Google BigQuery es la pieza central de la estrategia de datos de Google y es la plataforma de datos unificada que permite a los usuarios almacenar, analizar y visualizar multipetabytes de datos multimodales.
BiqQuery es un servicio totalmente gestionado que admite datos estructurados y no estructurados, incluidos formatos de tablas abiertas; soporta múltiples motores de procesamiento; procesa datos a través de múltiples nubes; ingiere datos en lotes y a través de streaming en tiempo real (IOT, Social Media Feeds, Eventos etc.)
En la era de la IA, es importante señalar que la IA llega a donde están los datos y no al revés. Con BigQuery ML, los modelos de IA se democratizan y se hacen accesibles a cualquier persona con conocimientos básicos de SQL. Esto convierte a BigQuery en una de las cargas de trabajo más estratégicas para todas las empresas. Muchos líderes del sector como Walmart, Spotify, Wayfair, Home Depot, Ford y Palo Alto Networks confían en BigQuery como su plataforma de datos preferida.
Para asegurarse de que sus datos de Google BigQuery están adecuadamente protegidos en múltiples dominios de fallo, necesitará una copia de seguridad y recuperación de clase empresarial que sea exhaustiva en lo que protege, coherente en los conjuntos de datos dependientes y granular durante la recuperación. HYCU R-Cloud es la primera y única solución de copia de seguridad empresarial que añade soporte de copia de seguridad y recuperación para Google BigQuery. Tenemos clientes que protegen los datos de BigQuery a varios TBs/minuto.
Llevando la innovación para BigQuery un paso adelante, HYCU ahora soporta Atomic Backup Sets para BigQuery. Los conjuntos de copias de seguridad atómicas están diseñados para garantizar vistas y consultas coherentes de los datos repartidos en varios conjuntos de datos en BigQuery. Ya se trate de conjuntos de datos dependientes de distintas fuentes o de vistas cruzadas entre distintos conjuntos de datos, las organizaciones están ahora protegidas contra la pérdida de datos durante mucho más tiempo que la ventana de viaje en el tiempo de una semana que tienen a su disposición los usuarios de BigQuery con una copia coherente.
Por qué la protección de datos es importante para BigQuery
La razón número uno por la que necesita proteger sus datos de BigQuery es para evitar la pérdida de datos. La pérdida de datos en Google BigQuery puede ocurrir por varias razones, por lo que es crucial ser consciente de los riesgos. He aquí algunos escenarios comunes:
- Fallos a nivel de zona y a nivel inferior: Los problemas de hardware o de red en una zona específica pueden hacer que sus datos no estén disponibles o incluso que se pierdan si no se replican en otras zonas.
- Fallos regionales: Los grandes acontecimientos, como los desastres naturales, pueden afectar a toda una región. Si sus copias de seguridad sólo se almacenan allí, podría perder el acceso a sus datos cuando más los necesite.
- Bugs en el código SQL: Pequeños errores en las consultas SQL pueden borrar o corromper datos accidentalmente si no se aplican medidas de protección.
- Errores humanos: Los borrados accidentales o los errores de configuración pueden provocar pérdidas de datos involuntarias.
- Amenazas internas: Las personas autorizadas pueden borrar o filtrar datos intencionadamente, lo que supone graves riesgos para la seguridad de sus datos.
Ser consciente de estos riesgos le ayuda a tomar medidas para proteger sus datos en BigQuery.
El elevado coste de recrear su conjunto de datos de BigQuery
Tradicionalmente, los almacenes de datos son una copia de datos transformados de múltiples fuentes, y muchos se preguntan por qué es necesario realizar copias de seguridad. Sin embargo, una consideración importante es tener en cuenta el tiempo que se tarda y los costes que supone recrear el almacén si se produce una pérdida sostenida de datos. Los costes incluyen:
- ETL(Extraer, Transformar, Cargar)
- Streaming
- API
- Servicios de tuberías, salida y más.
Además, con sistemas de escalado masivo como BigQuery, muchos clientes confían en el streaming de eventos en tiempo real para poblar el almacén de datos y muchas veces recrearlo ni siquiera sería posible porque su única copia de datos se almacena como un conjunto de datos de BigQuery.
Aunque las capacidades de viaje en el tiempo y de instantánea están disponibles a través del servicio, la protección más allá de siete días requiere una copia de seguridad. Las modernas regulaciones como DORA requieren un dominio de fallo mayor para las aplicaciones críticas. La mayoría de las industrias reguladas, como Sanidad y Finanzas, también están sujetas a requisitos de cumplimiento, retención a largo plazo y durabilidad.
¿Por qué conjuntos de copia de seguridad atómicos?
Aunque BigQuery puede manejar fácilmente conjuntos de datos masivos, es habitual que los usuarios de BigQuery segmenten sus datos en varios conjuntos de datos. Esta segmentación les ofrece un mejor control sobre:
- Organización y gestión de datos
- Control de acceso granular
- Optimización del rendimiento y de las consultas
- Gestión del coste de las consultas
- Gestión del ciclo de vida de los datos/expiración de registros
Incluso con conjuntos de datos segmentados, BigQuery ofrece varias formas de analizar y extraer datos a través de estos conjuntos de datos mediante consultas federadas, uniones entre conjuntos de datos, vistas, etc. Las vistas son tablas virtuales que proporcionan una forma de encapsular consultas complejas y presentarlas como tablas simples. Esto resulta especialmente útil para crear consultas reutilizables que puedan compartirse entre distintos equipos y, a menudo, se convierte en el método principal a través del cual los usuarios de BigQuery consumen los datos.
Durante la copia de seguridad, es por tanto importante que estos conjuntos de datos subyacentes estén protegidos con una versión del mismo punto en el tiempo para que estas vistas sean fiables. Otro punto clave a tener en cuenta es que a medida que estos conjuntos de datos se hacen más grandes, las copias de seguridad tradicionales crean una ventana de inconsistencia más grande y, por lo tanto, hacen que estos conjuntos de copias de seguridad atómicas sean más críticos.
También es importante tener en cuenta que la exportación de datos desde BigQuery no incluye los datos de Time Travel y no se puede retroceder hasta un punto consistente. Como resultado, tener la capacidad de crear una coherencia coordinada en el momento de la copia de seguridad es de vital importancia.
Los conjuntos de copia de seguridad atómicos son una nueva y potente capacidad que permite a los usuarios agrupar conjuntos de datos y garantizar que se realiza una copia de seguridad de los mismos en el mismo punto en el tiempo en todo el conjunto. Esto resulta especialmente útil para mantener la integridad de los datos entre conjuntos de datos relacionados.
Beneficios del uso de Conjuntos de copia de seguridad atómicos
- Integridad de los datos: Garantiza que los conjuntos de datos relacionados sean coherentes entre sí, evitando las discrepancias que pueden surgir al exportar conjuntos de datos en momentos diferentes. Las vistas que hacen referencia a tablas de otros conjuntos de datos son comunes y la exportación conjunta de estos conjuntos de datos dependientes ayuda a lograr una mayor coherencia.
- Gestión simplificada: La agrupación de conjuntos de datos facilita la gestión y organización de sus exportaciones de datos.
- Fiabilidad mejorada: Al proteger los conjuntos de datos en el mismo punto en el tiempo, se reduce el riesgo de que los datos no coincidan y se mejora la fiabilidad de sus análisis de datos.
¿Qué tan fácil es lograr Conjuntos de copia de seguridad atómicos?
En HYCU, siempre nos esforzamos por ponérselo fácil a los clientes. La creación de Conjuntos de copias de seguridad atómicas es tan sencilla como crear una etiqueta Atomic-Backup-set con los conjuntos de datos asociados etiquetados. Esta etiqueta le permite definir qué conjuntos de datos deben agruparse. Cuando se inicie una copia de seguridad, todos los conjuntos de datos con el mismo valor de etiqueta Atomic-Backup-set se protegerán utilizando el mismo punto en el tiempo, lo que garantiza la coherencia de la agrupación de sus datos. Actualmente, esta agrupación sólo está disponible para los conjuntos de datos de BigQuery alojados dentro de la misma región.
Cómo empezar con Atomic Backup Sets
Para empezar a utilizar Atomic Backup Sets en sus copias de seguridad de BigQuery, siga estos sencillos pasos:
- Etiquete sus conjuntos de datos: Añada la etiqueta Atomic-Backup-set a los conjuntos de datos que desee proteger juntos. HYCU mostrará un nuevo grupo en la interfaz de usuario de R-Cloud con el formato __
-

- Asocie la política: Asocie la política de copia de seguridad que desee al nuevo grupo en HYCU R-Cloud. Cuando la política inicie la copia de seguridad para BigQuery, HYCU agrupará automáticamente y realizará la copia de seguridad de los conjuntos de datos BigQuery con la misma etiqueta Atomic-Backup-set en el mismo momento.

Recuperación de conjuntos de datos BigQuery
Sus opciones de recuperación siguen siendo flexibles. Puede seguir recuperando conjuntos de datos y tablas individuales, en el mismo proyecto o en un proyecto diferente con el mismo nombre o con un nombre nuevo. Cualquier conjunto de datos que forme parte del conjunto de copia de seguridad atómica tendrá puntos de recuperación protegidos en el mismo momento. Cuando restaura conjuntos de datos, las vistas y rutinas también se restauran junto con él.
Conclusión
La introducción por parte de HYCU de los Conjuntos de copia de seguridad atómicos en las exportaciones de BigQuery supone un importante paso adelante en la gestión de datos. Al aprovechar las agrupaciones de coherencia y las copias de seguridad atómicas, puede asegurarse de que sus conjuntos de datos BigQuery sean coherentes, fiables y más fáciles de gestionar. Tanto si se trata de análisis de datos a gran escala, tendencias, minería sobre datos históricos, o simplemente necesita mantener la integridad de los datos, los conjuntos de copias de seguridad atómicas proporcionan una solución sólida para satisfacer sus necesidades.
BigQuery.