Python Programming Language for Data Analysis

Description

The Course Name: Python Programming Language for Data Analysis

The Course Duration: 35 Hours / 5 Days

The Course Index:

In this course Python Programming Language will be reviewed in detail. However,

the focus of this course is about Data Analysis. Specifically we will review scipy

ecosystem for Data Analysis: numpy, pandas, and matplotlib. This course is useful

for Analyzing Data, Designing Data Models, Generating Reports, and Creating Graphics.

DevOps Admins, Financial Analysts, Network Programmers, Linux System Admins, Security Admins

Database Admins, Automation and Test Engineers and Data Analysts benefit from this course.

Course Outline

Language Overview

 – Why Python is popular on many areas?

 – Data Analysis

 – Network Programming

 – System Automation

 – Machine Learning (ML)

 – Artificial Intelligence (AI)

 – Big Data and Database Management

 – Cryptography and Security

Introduction and Installation

 – Philosophy of Python, PEP20

 – Using Python with Jupyter Notebook on Windows

 – Differences of Python 2 and Python 3

 – PEP8 for Python Coding Style

 – Multi-paradigm Language

– Procedural Programming

– Object Oriented Programming

– Functional Programming

Data Types and Documentation

 – How to use documentation

 – The Python Standard Library

 – Built-in Functions and Modules

 – Basic Operators and Type Casting

 – Numeric Data Types and Functions

 – String Data Type and Functions

Flow Control

 – if-else

 – For loop

 – While loop

Functions

 – Scope Rules

 – Pass by Value/Reference

 – Recursion

 – Functions in Random Module

File Operations

 – Open a File with r/w/a/b Modes

 – File Operations

 – File and Directory Methods

Exception

 – Exception Types

 – Multiple Exceptions

 – try-exception block

 – Finally expression

Lists and Tuples

 – Immutable vs Mutable Types

 – List and Tuple Functions

 – Comparison

 – Conversion

 – Multi-dimensional Lists and Tuples

Dictionaries

 – Key and Value Pairs

 – Dictionary Funtions

 – Sorting and Converting

Dates and Times

 – Understanding Time

 – The time Module

 – The datetime Module

Regular Expressions

 – Regex Module

 – Search vs. Match

 – Find and Replace

 – Option Flags

 – Special Char Classes

Object Oriented Programming Basics

 – Encapsulation and Information Hiding

 – Inheritance

 – Polymorphism

 – Overloading and Overriding Methods

Functional Programming Basics

 – List Comprehensions

 – Map Function

 – Reduce Function

 – Filter Function

 – Lambda Expressions

Introduction to Data Analysis

 – Understanding the Nature of the Data

 – The Data Analysis Process

 – Problem Definition

 – Data Extraction

 – Python and Data Analysis

The NumPy Library

 – Ndarray

– Create an Array

– Types of Data

– The dtype Option

– Initialization of an Array

 – Basic Operations

– Arithmetic Operators

– The Matrix Product

– Universal Functions (ufunc)

– Aggregate Functions

 – Indexing, Slicing, and Iterating

 – Conditions and Boolean Arrays

 – Shape Manipulation

 – Array Manipulation

 – Joining and Splitting

 – Vectorization

 – Broadcasting

 – Reading and Writing Array Data on Files

The Pandas Standard Library

 – The Series

– Defining a Series from NumPy Arrays and Other Series

– Filtering Values

– Operations and Mathematical Functions

– Series as Dictionaries

– Operations Between Series

 – The DataFrame

– Defining a Dataframe

– Assigning Values

– Deleting a Column

– Filtering

 – The Index Objects

– Methods on Index

– Index with Duplicate Labels

– Reindexing

– Dropping

 – Operations Between DataFrame and Series

 – Function Application and Mapping

– Functions by Element

– Functions by Row or Column

– Statistics Functions

– Sorting and Ranking

 – “Not a Number” Data

– Assigning a NaN Value

– Filtering Out NaN Values

– Filling in NaN Occurrences

The Pandas: Reading and Writing Data

 – Reading Data in CSV or Text Files

 – Reading and Writing HTML Files

 – Reading Data from XML

 – Reading and Writing Data on Microsoft Excel Files

 – JSON Data

The Pandas: Data Manipulation

 – Merging

 – Concatenating

 – Pivoting

 – Data Transformation

 – Random Sampling

 – String Manipulation

 – Regular Expressions

 – Data Aggregation

 – Group Iteration

Data Visualization with matplotlib

 – The matplotlib Architecture

 – pyplot

 – Using the kwargs

 – Adding Elements to the Chart

 – Saving Your Charts

 – Line Charts

 – Histograms

 – Bar Charts

 – Pie Charts