DataOps مجموعه ای از روشها، فرآیندها و تکنولوژیهایی است که دیدگاهی یکپارچه و فرآیندگرا در ارتباط با دادهها را با خودکارسازی روشهای سریع مهندسی نرمافزار برای توسعه و بهبود کیفیت، سرعت و همکاری و ترویج فرهنگ توسعه مداوم در زمینه تحلیل دادهها ترکیب میکند.[۱] DataOps که بصورت مجموعه ای از بهترین شیوهها شروع بکار کرد، اکنون به یک رویکرد جدید و مستقل برای تحلیل دادهها تبدیل شده است.[۲] DataOpsبرای کل چرخه داده[۳] از آمادهسازی داده تا گزارشدادن اعمال میشود و ماهیت بههمپیوسته تیم تحلیل دادهها و عملیات فناوری اطلاعات را نیز تشخیص میدهد.[۴]
DataOps اصول Agile را برای کوتاهتر کردن چرخه زمانی توسعه تجزیه و تحلیل در راستای اهداف تجاری ترکیب میکند.[۳]
DevOps با استفاده از منابع IT بر پایه تقاضا و خودکارسازی آزمونها و گسترش نرمافزارها بر تحویل مداوم و یکپارچه تمرکز دارد. این ادغام توسعه نرمافزار و عملیاتهای IT، سرعت، کیفیت، قابلیت پیشبینی و مقیاس مهندسی نرمافزار و گسترش و استقرار را بهبود بخشیده است. DataOps با استفاده از روشهای DevOps، به دنبال ایجاد همین پیشرفتها در تحلیل دادهها است.[۴]
DataOps از کنترل آماری فرایندها (SPC) برای نظارت و کنترل بر خط لوله تحلیل دادهها استفاده میکند. باوجود SPC داده هایی که از طریق یک سیستم عملیاتی جریان میابند، دائماً تحت نظارت هستند و فعال بودن آنها تأیید میشود. اگر ناهنجاریای رخ دهد، تیم تحلیل داده توسط هشدار خودکاری مطلع میشوند.[۵]
DataOps به یک فناوری، معماری، ابزار، زبان و یا چهارچوب خاص وابسته نیست. ابزارهایی که از DataOps پشتیبانی میکنند، همکاری، هماهنگی، کیفیت، امنیت، دسترسی و آسانی استفاده را بهبود بهبود میبخشند و ارتقاء میدهند.[۶]