Număr de credite: 6
Cod: AMR0167
Predare: 2h de curs
Limba de predare: Română
Tip: curs principal, semestrul 3, Masteratul Analiza Datelor Complexe
1. Tematica și instalarea softurilor necesare
- Pașii unui proiect de analiză de date
- Instalarea softurilor necesare cursului
- Configurarea unui mediu de lucru virtual
2. Recapitularea conceptelor cheie introductive în limbajul de programare Python pentru analiza datelor
- Tipuri de date în Python și SQL
- Biblioteci Python pentru Analiză de Date (pandas, numpy)
- Structuri de control și funcții
3. Versionare și colaborare cu ajutorul Git
- Introducere în Git
- Operațiuni de Commit și Push
- Branching și Merge în Git
- Versionare și Colaborare în Git
4. Accesarea unui API
- Surse de date
- Noțiuni de bază pentru accesarea unui API (requests, chei API, apeluri API)
- Conectarea la un API și descărcarea datelor
5. Baze de date
- Conectarea și extragerea datelor din baze de date externe
- Interogarea bazei de date din Notebook-ul Python (Pandas și SQL)
- Popularea unei baze de date din Notebook-ul Python
6. Explorarea preliminară și curățarea datelor
- Prima inspecție si înțelegerea datelor
- Lucrul cu DataFrame-uri vs. dicționare vs. JSON
- Identificarea și gestionarea datelor lipsă
- Tehnici de curățare a datelor
- Gestionarea datelor lipsă
7. Agregarea datelor din surse diverse
- Unirea mai multor tabele
- Indexare și filtrare
- Agregarea datelor
- Gruparea datelor
- Utilizarea funcțiilor lambda
8. Feature Engineering
- Crearea de caracteristici derivate
- Operații matematice pentru transformarea ori crearea de noi atribute
- Encodare și scalare
9. Analiza Exploratorie a Datelor
- Explorarea distribuțiilor
- Statistici descriptive
- Utilizarea tabelelor de contingentă pentru analiza asociațiilor
- Analiza de corelații
10. Vizualizarea datelor
- Utilizarea graficelor și vizualizărilor pentru înțelegerea datelor
- Utilizarea bibliotecilor de vizualizare interactivă
11. Statistici inferențiale și raportare
- Teste de ipoteze și interpretarea rezultatelor
- Regresia liniară
- Prezentarea concluziilor statistice
12. Raportarea analizei și a rezultatelor
- Elaborarea și prezentarea rapoartelor pentru proiectele de analiză de date
- Utilizarea platformelor de vizualizare și prezentare
- Etică și integritată în raportarea datelor și a rezultatelor
Coroborarea conținuturilor disciplinei cu așteptările reprezentanților comunității epistemice, asociațiilor profesionale și angajatorilor reprezentativi din domeniul aferent programului
- Dezvoltarea abilităților de analiză a datelor: Acest curs ar putea ajuta compania să dezvolte resurse umane capabile să analizeze și să interpreteze datele în mod integrat, contribuind la luarea deciziilor informate și la identificarea oportunităților de îmbunătățire a operațiunilor.
- Raportarea eficientă: Competențele în analiza integrată a datelor și raportare pot ajuta compania să creeze și să furnizeze rapoarte eficiente, oferind informații valoroase pentru luarea deciziilor strategice.
- 70% proiect colectiv final
- 30% 3 teme pentru acasă
- 10% prezență
Obiectivul general:
Scopul principal al cursului "Relaționarea și Analiza Datelor pentru Cercetarea Empirică" este de a dezvolta competențele necesare pentru gestionarea și analiza datelor în cadrul cercetărilor empirice, utilizând Python și instrumente precum Git. Cursul se concentrează pe învățarea tehnicilor de curățare, explorare și vizualizare a datelor, precum și pe aplicarea ingineriei datelor pentru a pregăti seturile de date brute și a le transforma în date utilizabile în analiză.
Obictive specifice:
- Competențe Solide în Utilizarea Python pentru Analiza Datelor: Obiectiv Specific 1: Dezvoltarea unei expertize solide în utilizarea limbajului de programare Python pentru analiza datelor, inclusiv gestionarea seturilor de date, manipularea datelor și aplicarea tehnicilor de analiză.
- Gestionarea Versiunilor și Colaborarea Eficientă cu Git: Înțelegerea și aplicarea conceptelor și instrumentelor de gestionare a versiunilor folosind Git pentru a lucra eficient în echipă și pentru a urmări modificările în cod și date.
- Explorarea și Curățarea Datelor în Profunzime: Dezvoltarea abilităților avansate în explorarea și curățarea datelor, inclusiv identificarea și gestionarea datelor lipsă, agregarea și gruparea datelor pentru analiza ulterioară și aplicarea tehnicilor de inginerie de caracteristici.
- Analiza și Vizualizarea Datelor pentru Cercetarea Empirică: Învățarea și aplicarea analizei exploratorii avansate a datelor, interpretarea rezultatelor și reprezentarea vizuală a informațiilor obținute, contribuind astfel la procesul de cercetare empirică.
Acest curs se studiază în următoarele programe:
B-dul 21 Dec. 1989 Nr. 128, Cluj-Napoca 400604
+ 40-264-42.46.74
+ 40-264-41.99.58
+ 40-264-42.46.74