Аналіз декларацій чиновників

Views:
 
Category: Education
     
 

Presentation Description

No description available.

Comments

Presentation Transcript

Аналіз декларацій чиновників:

Аналіз декларацій чиновників

Declarations.com.ua:

Declarations.com.ua Краудсорсинговий проект з оцифровки і розшифровки декларацій про доходи українських чиновників всіх рівнів

Як це працює?:

Як це працює? Реєструємось на сайті Отримуємо завдання Заповнюємо форму Знаходимо декларацію і додаємо її в базу

Мета:

Мета Створити зручний інструмент для пошуку історій у деклараціях За допомоги статистичного аналізу виявляти підозрілі декларації Доповнювати декларації інформацією з інших баз даних

Наявний функціонал:

Наявний функціонал Пошук за прізвищем Фільтр за регіоном і установою Аналітика

Запланований функціонал:

Запланований функціонал Фільтри (не лише за регіонами і установами, а й за пунктами декларації) Сортування Завантаження вибраної інформації Долучення зовнішніх баз даних Більш глибока і різноманітна аналітика

Напрямки роботи:

Напрямки роботи Аналіз структури доходів Порівняння доходів і майна декларанта із доходами і майном родини Порівняння доходів декларанта і родини із майном Пошук незадекларованого майна Пошук бізнесів родини

Як працювати із даними:

Як працювати із даними

Рівні дослідження:

Рівні дослідження мікрорівень (дослідження однієї декларації) макрорівень (дослідження масиву декларацій)

Ключові характеристик даних:

Ключові характеристик даних Ширина (кількість колонок) Довжина (кількість рядків) Типи чи класи даних (числа, фактори, дати) Метаінформація (опис колонок)

Базові статистики:

Базові статистики Five number summary: мінімум перший квартиль медіана третій квартиль максимум

Базові статистики:

Базові статистики Mean (average) VS Median Середнє [2, 7, 11, 15, 90] = 25 Медіана [2, 7, 11, 15, 90] = 11

Базові статистики:

Базові статистики Стандартне відхилення (average distance from the mean) Викид ( > 2 SD from the mean)

Базові операції:

Базові операції Обираємо цікаві змінні Фільтруємо за певними факторами чи характеристиками Групуємо і агрегуємо дані Створюємо нові змінні

Що можна зробити?:

Що можна зробити? Подивитись, які пункти декларацій заповнюють, а які ні Вибрати кілька цікавих пунктів (подарунки, викладацька діяльність, матеріальна допомога) і дослідити їх

Що можна зробити?:

Що можна зробити? Дослідити структуру доходів (з яких джерел декларант отримує найбільш доходу?) Дослідити співвідношення доходів/майна декларанта і його родини

Як в цьому допомагає графіка?:

Як в цьому допомагає графіка? Дозволяє виявити патерни Допомагає ідентифікувати викиди і підозрілі випадки

Які графіки стануть в пригоді?:

Які графіки стануть в пригоді? ящик з вусами (box plot) гістограма діаграма розсіяння (scatterplot)

Boxplot:

Boxplot Дозволяє побачити всі базові характеристики даних (мінімум, максимум, медіана, квартилі, викиди)

Гістограма:

Гістограма Дозволяє побачити розподіл величин у наборі даних (ідентифікувати нормальний і ненормальний розподіл)

Діаграма розсіяння:

Діаграма розсіяння Дозволяє співставити на осі координат дві величини (простежити залежність, кореляцію)

Завдання:

Завдання Відфільтруйте дані за певним показником (наприклад, за банківськими депозитами) Відфільтруйте дані за додатковим показником (посадою, установою чи регіоном) Відсортуйте від найбільшого до найменшого

Завдання:

Завдання Відфільтруйте з даних декларації чиновників своєї області Візьміть два показники (наприклад, дохід декларанта і його родини), створіть на їх основі новий Відсортуйте за новоствореним показником

Завдання:

Завдання Оберіть з даних один показник (наприклад, кількість машин), створіть гістограму Оберіть два показники, створіть діаграму розсіяння

Slide25:

[email protected] fb/andriy.gazin twiiter/AndriyGazin Game Over

authorStream Live Help