Big Data Analytics - Amrita Vishwa Vidyapeetham

Course Detail

Course Name	Big Data Analytics
Course Code	23AID302
Program	B.Tech in Artificial Intelligence and Data Science
Semester	5
Credits	3
Campus	Coimbatore , Amritapuri ,Faridabad , Bangaluru, Amaravati

Syllabus

Unit 1

Introduction to Big Data Analytics: Definition, characteristics, and importance of big data, tools and technologies for big data analytics, State-of-the-art computing paradigms/platforms, Hadoop ecosystem in Brief, Mapper, Reducer.

Unit 2

Introduction to Functional Programming (FP), FP concepts in Scala Programming, Mutable and Immutable Data structures, Scala Collections, Type Hierarchy, Higher Order Functions, Closures, ConsList, Tail Recurrsion, Object Oriented Programming in Scala, Introduction to concurrency

Unit 3

Basic entity classes and objects in Scala, Spark Architecture, Spark Cluster, Resilient Distributed Datasets (RDDs), Spark Transformations and Actions APIs, DataFrames and Datasets in Spark, Basic Operations on RDDs and DataFrames, lazy evolutions and optimization, Directed Acyclic Graph (DAG)

Unit 4

Introduction to Machine Learning with Spark, MLlib and its algorithms, Building a Machine Learning Pipeline in Spark, Case Study in Healthcare, Finance, etc.

Objectives and Outcomes

Course Objectives

This course aims at introducing the concept of data structure hierarchy.
It will also expose the students to the basic and higher order data structures.
Further the students will be motivated to apply the concept of data structures to various engineering problems.

Course Outcomes

After completing this course, students will be able to

CO1	Implement functional and object-oriented programs in Scala, including using higher-order functions, pattern matching, and type classes
CO2	Create and maintain a Spark deployment, including cluster configuration, resource allocation, and job monitoring
CO3	Deploy of Spark for various use cases, such as ETL, data warehousing, and real-time analytics.
CO4	Analyze real-world data sets and extract meaningful insights using statistical and machine learning techniques

CO-PO Mapping

PO/PSO

PO1

PO2

PO3

PO4

PO5

PO6

PO7

PO8

PO9

PO10

PO11

PO12

PSO1

PSO2

PSO3

CO1

–

CO2

–

CO3

–

CO4

–

Evaluation Pattern

Evaluation Pattern

Assessment	Internal/External	Weightage (%)
Assignments (Minimum 3)	Internal	30
Quiz(Minimum 2)	Internal	20
Mid-Term Examination	Internal	20
Term project/End semester examination	External	30

Text Books / References

Text Books / References

‘Learning Spark: Lightning-Fast Big Data Analysis’, Holden Karau , Andy Konwinski, Patrick Wendell and MateiZaharia, O′Reilly; 1st edition , 2015

‘Programming in Scala: A Comprehensive Step-by-Step Guide’, Martin Odersky,Lex Spoon andBill Venners, Artima Inc; Version ed. edition , 2008

‘High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark’, Holden Karau, Rachel Warren, O′Reilly; 1st edition, 2017

‘Scala for the Impatient’, Cay S. Horstmann, Addison-Wesley; 2nd edition, 2017

DISCLAIMER: The appearance of external links on this web site does not constitute endorsement by the School of Biotechnology/Amrita Vishwa Vidyapeetham or the information, products or services contained therein. For other than authorized activities, the Amrita Vishwa Vidyapeetham does not exercise any editorial control over the information you may find at these locations. These links are provided consistent with the stated purpose of this web site.

About Amrita Vishwa Vidyapeetham

Rankings

Accreditation

Governance

Chancellor

Leadership

Press Media

Newsletters

Amritapuri
Campus

Amaravati
Campus

Bengaluru
Campus

Chennai
Campus

Coimbatore
Campus

Faridabad
Campus

Kochi
Campus

Mysuru
Campus

Nagercoil
Campus

Haridwar

Research

Centers

Patents

Course

Course Detail

Syllabus

Unit 1

Unit 2

Unit 3

Unit 4

Objectives and Outcomes

Evaluation Pattern

Text Books / References

Interests

Programs

Research

About Amrita

Resources

Locations

Reports

About Amrita Vishwa Vidyapeetham

Amritapuri Campus

Amaravati Campus

Bengaluru Campus

Chennai Campus

Coimbatore Campus

Faridabad Campus

Kochi Campus

Mysuru Campus

Nagercoil Campus

Haridwar

Research

Programs

From the news

Others

Course

Course Detail

Syllabus

Unit 1

Unit 2

Unit 3

Unit 4

Objectives and Outcomes

Evaluation Pattern

Text Books / References

Amritapuri
Campus

Amaravati
Campus

Bengaluru
Campus

Chennai
Campus

Coimbatore
Campus

Faridabad
Campus

Kochi
Campus

Mysuru
Campus

Nagercoil
Campus