Veri bilimi, karmaşık problemleri çözmek için hem yapılandırılmış hem de yapılandırılmamış veriyi, işe yarar/değerli bilgiye (knowledge) dönüştürmeye yarar.
Günümüzde veri bilimi denilince akla ilk gelen programlama dili Python’dur. Kolay öğrenilebilmesi, kolay okunması, bakımının kolay olması ve hazır birçok veri bilimi kütüphanesi bulundurması, dilin kullanımını oldukça yaygınlaştırmıştır . Popülerliği ve kullanımı arttıkça, var olan kütüphaneleri daha fazla gelişmekte ve ayrıca yeni kütüphaneler de eklenmektedir. Eğitimimizde Python diline veri bilimi perspektifinden hızlı ama detaylı bir giriş yapıp, önemli paketlerden NumPy ve Pandas ile ilgili bilgi verip, örnekler yapacağız.
Veri bilimini, öngörüler elde etmek için verileri ayıklamak, analiz etmek, görselleştirmek, yönetmek ve depolamak gibi tüm bu süreçleri kullanan multidisipliner bir alan olarak tanımlayabiliriz. Veri bilimcisi ise büyük miktarlardaki veriyi toplamak, analiz etmek ve yorumlamaktan sorumlu kişidir. Özellikle son yıllarda, veri bilimcilerine olan talep gittikçe artmaktadır. Son yapılan araştırmalara göre, veri bilimcilik Linkedln ' de en hızlı büyüyen iş olmuştur ve 2026 yılına kadar 11.5 milyon iş yaratacağı tahmin edilmektedir. Bu, veri bilimini son derece istihdam edilebilir bir iş sektörü haline getirmektedir. Veri bilimine olan talep arttıkça birçok üniversite de veri bilimi alanında yüksek lisans ve doktora bölümleri açmaya başlamıştır.
Veri bilimi, belirli bir bilgi tabanının nereden geldiğini inceleyen bir disiplindir. Ayrıca, bu kaynakların verimli kullanım için nasıl yorumlanabileceğini ve temsil edilebileceğini tartışır.
Veri bilimi, büyük miktarda veri ile çalışması gereken şirketler veya kurumlar için önemlidir. Böylece, bunlar değerli bilgiler haline gelebilir. Veri bilimini, çeşitli kaynaklardan gelen devasa verileri işleyebilen ve yönetebilen mekanizmalar geliştirmekten oluşan Büyük Veri ile ilişkilendirebiliriz. Amaç, bunları insan tarafından yorumlanabilecek ve karar vermesine yardımcı olacak bilgilere dönüştürmektir.