Power BI - Supprimer les colonnes non nécessaires Tutoriels

Découvrez comment supprimer les colonnes non nécessaires pour une utilisation professionnelle dans Microsoft 365 grâce à cette vidéo informative.
Cette vidéo présente les fonctionnalités clés de Power Query pour sélectionner et supprimer les colonnes inutiles de vos données importées à partir de sources externes.
Obtenez des conseils pratiques pour utiliser les outils de Power Query pour nettoyer et préparer vos données en vue de leur utilisation dans Power BI ou Excel.
Suivez cette vidéo pour en savoir plus sur la suppression de colonnes non nécessaires et comment Microsoft 365 peut vous aider à améliorer les performances de votre entreprise.

  • 15:03
  • 3159 vues
Lecteur vidéo en cours de chargement.
Introduction
Temps actuel 0:00
Durée 0:00
Chargé: 0%
Type de flux EN DIRECT
Temps restant 0:00
1x
  • Chapitres
  • descriptions désactivées, sélectionné
  • Sous-titres désactivés, sélectionné
    00:00:02
    Alors, maintenant qu'on
    00:00:03
    enregistre notre fichier,
    00:00:04
    on va pouvoir commencer à réaliser
    00:00:06
    nos premiers retraitements,
    00:00:07
    donc pour ça, une fois qu'on est ici,
    00:00:08
    on va aller dans transformer les données.
    00:00:11
    Transformer les données qui vont
    00:00:13
    nous permettre d'afficher Power Query
    00:00:15
    et la première élément intéressant,
    00:00:17
    on voit que y a déjà eu des étapes
    00:00:18
    de retraitement alors qu'on a
    00:00:20
    rien demandé à un souvenez-vous,
    00:00:21
    on a juste fait un chargement de de
    00:00:23
    données et c'est pour ça qu'on l'a fait.
    00:00:24
    C'était pour vous montrer justement
    00:00:26
    la sorte d'intelligence qui
    00:00:28
    peut y avoir dans proverbial,
    00:00:29
    donc nous en gros ce qu'on a demandé,
    00:00:31
    c'est cette première étape qui est ici,
    00:00:32
    qui est la source de données .
    00:00:34
    Donc Pour rappel,
    00:00:35
    si je clique ici sur la Pedro édentée,
    00:00:38
    on va avoir le chemin d'accès
    00:00:39
    au fichier si vous êtes trompé,
    00:00:41
    bien vous pouvez cliquer ici
    00:00:42
    sur parcourir. Pour le refaire ?
    00:00:46
    Et ensuite, on va aller dans navigation,
    00:00:48
    donc ça c'est normal, ,
    00:00:49
    c'est quand on a sélectionné l'onglet
    00:00:51
    un pour pouvoir travailler et par
    00:00:53
    contre ce qui est intéressant c'est
    00:00:54
    que il a détecté automatiquement le
    00:00:56
    fait que le tableau comportait des
    00:00:58
    entêtes donc ça c'est plutôt pas mal.
    00:01:00
    C'est lié au fait que le tableau
    00:01:02
    dans Excel était très bien préparé
    00:01:04
    dans le sens où ça a été déclaré en
    00:01:07
    tant que tableau dans Excel donc ce
    00:01:10
    qui explique après cette certaine
    00:01:12
    intelligence puisque Excel
    00:01:13
    c'est aussi Microsoft et on voit
    00:01:15
    autre un autre élément c'est que.
    00:01:17
    Il a modifié.
    00:01:18
    Et les types de certaines,
    00:01:21
    certaines colonnes,
    00:01:21
    donc là par contre,
    00:01:23
    il faudra aussi un petit peu
    00:01:24
    s'en méfier un peu,
    00:01:25
    ce qu’il peut déduire certaines choses
    00:01:26
    qui qui là pour le coup ne sont pas
    00:01:29
    forcément vraies donc ça impliquera
    00:01:30
    de toute façon de vérifier le type .
    00:01:32
    Pour rappel,
    00:01:33
    le type c'est ici donc sur chaque colonne
    00:01:36
    de pouvoir changer le type du de la,
    00:01:38
    de la colonne et ça c'est intéressant
    00:01:40
    pour justement pouvoir faire des
    00:01:42
    sommes sur par exemple des nombres,
    00:01:44
    des nombres de pouvoir,
    00:01:46
    calculer des durées entre 2 dates.
    00:01:48
    Donc ici il nous faudra des dates.
    00:01:50
    De pouvoir faire des concaténations des
    00:01:52
    extractions via une colonne de type texte,
    00:01:54
    et cetera, et cetera.
    00:01:56
    Donc c'est une étape assez importante
    00:01:58
    donc bien là on va dire que Power
    00:02:01
    courrier à plutôt bien fait son travail
    00:02:03
    et on va pouvoir commencer un petit
    00:02:06
    peu à continuer les modifications.
    00:02:08
    Donc la première étape que moi je
    00:02:10
    vous conseille là au moment vous avez
    00:02:12
    apporté votre premier jeu de données,
    00:02:14
    c'est de faire le tri dans les colonnes
    00:02:16
    que vous avez récupérées quand on
    00:02:19
    a exploré dans Excel le fichier,
    00:02:20
    on a vu qu'on avait potentiellement
    00:02:22
    des doublons.
    00:02:22
    Des choses qui n’étaient pas forcément
    00:02:24
    intéressantes de de de garder dans
    00:02:26
    le dans le fichier et donc on va
    00:02:28
    essayer de comprendre un peu dans quel
    00:02:30
    cas on doit supprimer des colonnes.
    00:02:34
    Alors,
    00:02:35
    imaginons qu'on travaille sur
    00:02:37
    des données de vente réalisées
    00:02:39
    par une, par une société.
    00:02:41
    Alors quels sont les grands pas de figure
    00:02:43
    dans lequel on peut se dire qu'on a
    00:02:44
    le droit de supprimer enfin le droit,
    00:02:46
    la possibilité de supprimer une colonne ?
    00:02:48
    Le premier, c'est que les données
    00:02:51
    sont inutiles pour le projet.
    00:02:53
    Là on est sur un sur un,
    00:02:57
    sur un récapitulatif des ventes qui
    00:02:59
    ont été réalisées par une société,
    00:03:01
    d'avoir par exemple le numéro
    00:03:03
    de téléphone des clients.
    00:03:04
    Dans un outil de visualisation,
    00:03:06
    ça ne va pas me servir à grand-chose.
    00:03:09
    Donc, pourquoi garder cette colonne
    00:03:11
    là qui va aller polluer mon tableau,
    00:03:13
    qui va potentiellement alourdir
    00:03:15
    aussi mon fichier,
    00:03:17
    donc là potentiellement si c'est
    00:03:18
    inutile pour ce que je cherche à faire,
    00:03:21
    bien je peux supprimer la colonne.
    00:03:24
    À noter que si vous n'êtes pas encore
    00:03:26
    certain que la colonne vous soit utile,
    00:03:29
    vous pouvez tout à fait la laisser et
    00:03:31
    ultérieurement la supprimer, ,
    00:03:32
    c'est on peut tout à fait faire des
    00:03:34
    suppressions un petit peu incrémentales,
    00:03:36
    un peu plus tard dans le retraitement.
    00:03:39
    Autre élément,
    00:03:40
    c'est des doublons,
    00:03:41
    alors ça arrive très souvent à
    00:03:43
    ce qu'on se connecte souvent à
    00:03:44
    des à des sources techniques,
    00:03:46
    donc c'est le fait que 2
    00:03:49
    colonnes remontent sensiblement,
    00:03:50
    soit exactement la même information,
    00:03:52
    soit quasiment.
    00:03:53
    Donc après question de format la
    00:03:55
    même information donc par exemple
    00:03:56
    ici dans le cas que je donne ces 2
    00:03:59
    colonnes donnant le mois de la vente,
    00:04:00
    il y en a une qui est au format écrit,
    00:04:02
    donc ça serait écrit joint et l'autre format.
    00:04:04
    Non ça sera écrit 6 donc là typiquement
    00:04:06
    ce n’est pas utile de garder les 2
    00:04:08
    c'est la même information.
    00:04:10
    Donc là le plus logique,
    00:04:11
    c'est tout simplement de garder le
    00:04:13
    format qui nous convient le mieux,
    00:04:14
    donc potentiellement le chiffre,
    00:04:16
    parce que je j'aurais tendance à
    00:04:20
    faire pour ensuite supprimer
    00:04:22
    la colonne de test de texte.
    00:04:24
    Donner un consistante,
    00:04:26
    donc là on se retrouve dans une
    00:04:29
    colonne ou dans 95% des cas,
    00:04:31
    la donnée n'est pas disponible donc
    00:04:33
    est-ce que c'est vraiment pertinent
    00:04:35
    de garder une colonne où il y a aussi
    00:04:38
    plus de aussi peu de données présentes
    00:04:40
    et donc là dans le cas que je donne
    00:04:43
    code le code imaginons un code barre ?
    00:04:45
    l'identifiant est très rarement renseigné
    00:04:49
    donc et ce que je vais pouvoir vraiment
    00:04:52
    exploiter une donnée sur 5% des lignes.
    00:04:54
    Peut-être pas,
    00:04:55
    et donc auquel cas il est plus
    00:04:57
    sage de supprimer la colonne.
    00:04:59
    Et le dernier élément,
    00:05:01
    c'est des données de mauvaise qualité,
    00:05:03
    donc imaginons que vous avez une
    00:05:05
    colonne qui est intitulée code
    00:05:06
    postal et que de temps en temps,
    00:05:07
    vous allez retrouver plutôt
    00:05:09
    le nom du magasin,
    00:05:11
    donc de temps en temps,
    00:05:12
    imaginons même dans la moitié des cas,
    00:05:14
    voire trop,
    00:05:14
    le nom du magasin donc ça fait preuve
    00:05:16
    un petit peu de de problématique qui
    00:05:18
    a pu avoir autour de cette colonne
    00:05:20
    là et donc potentiellement même les
    00:05:22
    codes postaux qui sont présents,
    00:05:23
    qui seraient normalement le bon format,
    00:05:25
    sont potentiellement fausses et donc
    00:05:27
    attention ça peut être dangereux.
    00:05:29
    Encore une fois,
    00:05:31
    vous n'êtes pas obligé de supprimer les
    00:05:33
    les colonnes quand vous avez un doute,
    00:05:36
    vous pourrez le faire un petit peu plus tard.
    00:05:37
    Mais globalement, quand vous avez un
    00:05:39
    petit peu près la réponse à l'esprit,
    00:05:41
    bien, vous pouvez directement
    00:05:43
    supprimer la colonne.
    00:05:45
    Donc pour ça, on va se retourner,
    00:05:47
    on va se rendre dans Power Query.
    00:05:53
    Ici, voilà, on va en profiter d'ailleurs
    00:05:56
    pour renommer notre jeu de données
    00:05:58
    qu'on va appeler ici festival. Voilà.
    00:06:05
    Et on va pouvoir un petit peu
    00:06:07
    regarder notre jeu de données,
    00:06:09
    donc le nom de la manifestation
    00:06:12
    je n’ai pas de souci avec ça.
    00:06:14
    La région non plus,
    00:06:16
    le domaine complément domaine.
    00:06:19
    Il n’a pas l'air très remplie alors
    00:06:21
    comment je sais ce qui est beaucoup
    00:06:23
    rempli où qui n'est pas beaucoup rempli,
    00:06:25
    donc vous avez cette sous barre ici
    00:06:26
    qui va vous donner un certain nombre
    00:06:29
    d'informations très intéressantes.
    00:06:30
    Donc le fait que on va avoir par
    00:06:34
    exemple ici 67% de Complétion de la
    00:06:37
    de la colonne donc dans 67% des cas,
    00:06:40
    la ligne possède une valeur.
    00:06:42
    Il va également nous donner
    00:06:44
    un indicateur de d'erreur,
    00:06:46
    donc potentiellement des lignes
    00:06:47
    qui comportent des erreurs.
    00:06:48
    On verra les types d'erreurs
    00:06:50
    qui sont qui sont possibles.
    00:06:51
    Et ensuite le nombre de colonnes vides.
    00:06:54
    Et ça, du coup, Vous voyez ici donc,
    00:06:55
    quand c'est vert,
    00:06:56
    bien c'est le,
    00:06:58
    la jauge en gros de complétion de
    00:07:00
    la de la colonne et il ne donne
    00:07:03
    déjà ici des options pour supprimer
    00:07:04
    par exemple les éléments vides,
    00:07:06
    donc à savoir les lignes qui sont,
    00:07:08
    qui sont vides donc évidemment là,
    00:07:09
    ici on va,
    00:07:10
    on ne va pas le faire parce que là on a
    00:07:12
    2/3 de de colonnes remplies donc ça
    00:07:14
    peut tout à fait être pertinent
    00:07:15
    en termes d'exploitation.
    00:07:17
    Autre point c'est important,
    00:07:19
    on voit que les colonnes qui
    00:07:21
    sont initialement vides dans le.
    00:07:23
    Dans le fichier ont ici été
    00:07:25
    complétés par la valeur nulle,
    00:07:27
    donc ça c'est très important et vous ne
    00:07:30
    ne trouverez jamais de valeur réellement vide.
    00:07:32
    En réalité,
    00:07:33
    puisque pouvoir Query
    00:07:34
    automatiquement et pouvoir bien,
    00:07:35
    il va remplacer ça par nul.
    00:07:37
    Il ne faut pas entendre ça par un vrai texte,
    00:07:40
    un vrai libellé,
    00:07:41
    c'est juste du coup une vision,
    00:07:44
    une manière de visualiser la valeur,
    00:07:46
    le fait que la valeur soit vide.
    00:07:48
    Mais comme vous voyez,
    00:07:49
    elle est en italique et donc elle
    00:07:50
    n'a pas vraiment de de valeur.
    00:07:52
    Par contre on pourra tout à
    00:07:53
    fait dire par exemple.
    00:07:54
    Je supprime toutes les valeurs nulles
    00:07:56
    d'une colonne et donc là du coup ça nous
    00:07:59
    aide beaucoup d'avoir une appellation
    00:08:00
    pour ce pour l'absence de valeur.
    00:08:04
    Ensuite, on va avoir le département.
    00:08:08
    La période de cité,
    00:08:09
    donc oui, ici,
    00:08:09
    pas spécialement de problème.
    00:08:11
    Le mot habituel du début,
    00:08:13
    on voit qu'il y a des petits
    00:08:14
    soucis de format scolaire,
    00:08:14
    on nous a mélangé de du chiffre et du mois,
    00:08:18
    mais l'information est pertinente,
    00:08:19
    donc on verra comment le ré
    00:08:21
    manipuler le site web pourquoi pas ?
    00:08:23
    On pourra en avoir une exploitation.
    00:08:25
    Le numéro d'identification,
    00:08:27
    donc ça assez important,
    00:08:28
    on va le garder aussi.
    00:08:30
    La commune principale ?
    00:08:32
    Autre commune donc là,
    00:08:33
    c'est le premier cas où on va
    00:08:35
    avoir un petit peu plus de mal à
    00:08:37
    à exploiter parce que déjà ça va
    00:08:39
    être assez compliqué de de se dire
    00:08:40
    que sur un festival on va concerner
    00:08:42
    plusieurs communes par exemple
    00:08:43
    pour faire afficher sur une carte,
    00:08:45
    ça sera beaucoup plus simple
    00:08:46
    d'avoir qu'un seul point et
    00:08:48
    en plus de ça au survol sur notre.
    00:08:51
    Lire notre colonne,
    00:08:53
    on voit que c'est vide dans 90% des cas,
    00:08:56
    donc là on est typiquement sur un cas où ça
    00:08:59
    n'est pas pertinent de garder la colonne,
    00:09:02
    donc on va avoir plusieurs méthodes,
    00:09:04
    pour supprimer une colonne,
    00:09:05
    la première que je vous montre ici,
    00:09:06
    c'est tout simplement de la sélectionner,
    00:09:09
    de faire un clic droit qui va ouvrir
    00:09:11
    tout un panneau de configuration
    00:09:12
    qui correspond très largement
    00:09:13
    à ce que vous allez trouver,
    00:09:15
    notamment dans l'onglet de
    00:09:17
    transformation directement dans
    00:09:19
    le dans le pouvoir I et ici on va
    00:09:22
    cliquer tout simplement sur supprimer.
    00:09:25
    On voit qu’une étape vient de cette ajouter,
    00:09:27
    , ici.
    00:09:30
    Et donc on va continuer ici
    00:09:34
    notre exploration,
    00:09:35
    donc la date de début,
    00:09:37
    donc on voit que ça manque beaucoup,
    00:09:39
    mais ça va quand même
    00:09:40
    m'être utile pour plus tard,
    00:09:41
    parce que notamment pour faire des
    00:09:43
    représentations dans le temps du,
    00:09:44
    du volume de festival donc on va le garder.
    00:09:47
    La date de fin, la date de création,
    00:09:49
    le code postal très bien,
    00:09:50
    code postal et code INSEE.
    00:09:52
    Alors ici nous dans notre cas,
    00:09:55
    moi je vous le dis,
    00:09:55
    on va surtout faire du travail à partir
    00:09:58
    du code postal donc le code Insee
    00:10:00
    c'est quelque chose d'assez différent.
    00:10:03
    Donc c'est une,
    00:10:03
    c'est une autre manière de
    00:10:05
    désigner une commune et ça
    00:10:07
    ne va pas trop m'intéresser.
    00:10:09
    Donc ici je vais plutôt avoir tendance
    00:10:12
    à supprimer cette colonne
    00:10:15
    là donc du code du code c'est.
    00:10:18
    Parce que ça correspond pour plus ou
    00:10:20
    moins pour moi à un doublon du code postal.
    00:10:23
    C'est juste un format un peu plus compliqué.
    00:10:27
    Alors, une autre méthode
    00:10:28
    pour supprimer une colonne,
    00:10:30
    donc on va ici la sélectionner.
    00:10:32
    On va se rendre dans accueil
    00:10:33
    et on voit ici qu'on a un item.
    00:10:35
    Gérer les colonnes et là il va
    00:10:37
    nous proposer 2 choses donc soit 2
    00:10:39
    choisir soit de supprimer l'école,
    00:10:41
    donc supprimer les colonnes.
    00:10:41
    c'est assez simple ,
    00:10:42
    ça a pas du coup supprimer les
    00:10:44
    colonnes que je sélectionnées et
    00:10:46
    donc Pour information je peux tout
    00:10:48
    à fait en maintenant majuscule ou
    00:10:50
    contrôle sur mon avis sur mon clavier
    00:10:53
    de pouvoir sélectionner 2 colonnes,
    00:10:55
    de retourner ici et de cliquer sur.
    00:10:58
    Supprimer les colonnes ?
    00:10:59
    Donc si je fais ça ici ?
    00:11:01
    Donc évidemment, pourra revenir en arrière.
    00:11:02
    Ça sera l'occasion de vous le montrer.
    00:11:05
    On voit que, bien,
    00:11:06
    il m'a supprimé les les,
    00:11:09
    les 2 colonnes à la fois.
    00:11:10
    Donc on va revenir en arrière.
    00:11:13
    On va retourner sur notre code INSEE.
    00:11:17
    Et on va retourner ici sur.
    00:11:20
    Le champ que je veux montrer,
    00:11:22
    donc gérer les colonnes supprimées et
    00:11:23
    maintenant j'ai une autre option qui
    00:11:25
    est supprimer les autres colonnes,
    00:11:27
    donc là ça va avoir l'effet
    00:11:28
    exactement inversé qui va être de
    00:11:30
    supprimer toutes les Colonnes sauf
    00:11:31
    celles que j'ai sélectionnées.
    00:11:32
    Donc pareil on va appliquer mais pas de
    00:11:34
    panique on pourra revenir en arrière.
    00:11:36
    Donc vous voyez ici,
    00:11:38
    il m'a uniquement conservé mes colonnes.
    00:11:42
    Donc on revient une nouvelle fois en arrière.
    00:11:45
    Et pour vous montrer la dernière
    00:11:47
    fonctionnalité autour de ça qu'on
    00:11:49
    va retourner sur notre code en C
    00:11:51
    et on va avoir le strict inversé,
    00:11:53
    c'est à dire choisir les colonnes,
    00:11:54
    choisir les colonnes,
    00:11:55
    ça va être justement de se dire,
    00:11:57
    bien, je choisis.
    00:11:59
    La colonne qui m'intéresse donc ici,
    00:12:01
    je vais avoir un champ qui va s'ouvrir,
    00:12:02
    donc là, ici,
    00:12:03
    je n'ai plus qu'à désépingler les potentiels,
    00:12:07
    les potentiels colonnes qui
    00:12:08
    ne m'intéressent pas.
    00:12:10
    Et donc il ira uniquement me
    00:12:11
    garder celle que j'ai sélectionnée
    00:12:13
    et de la même manière.
    00:12:17
    Si je recherche une colonne
    00:12:18
    en particulier parce que je ne
    00:12:20
    ne la trouve pas dans la liste,
    00:12:21
    je vais pouvoir ici par exemple,
    00:12:22
    cliquer sur. À mon fameux code INSEE.
    00:12:30
    Alors mon code pin c'est voilà
    00:12:32
    le code c'est quitte ici,
    00:12:33
    je sélectionne et donc qui va
    00:12:35
    m'emmener directement à la colonne
    00:12:37
    pour après potentiellement la
    00:12:39
    supprimer donc là ici je vais
    00:12:41
    repasser dans mon menu je vais
    00:12:44
    faire supprimer les colonnes.
    00:12:47
    Ou non, choisir les colonnes
    00:12:48
    tiens choisir les colonnes.
    00:12:52
    Et là, on voit du coup que.
    00:12:55
    Les autres communes parce
    00:12:56
    que j'ai supprimé l'étape,
    00:12:58
    n'a est à nouveau présent,
    00:13:00
    donc je vais ici cliquer sur des
    00:13:03
    engagés autres communes et je vais
    00:13:05
    également désengager code INSEE.
    00:13:07
    Je clique sur OK.
    00:13:09
    Et donc là on voit que j'ai un nouvel item
    00:13:12
    qui vient de se de ce de se supprimer.
    00:13:16
    Et donc on va pouvoir
    00:13:17
    continuer notre travail,
    00:13:18
    donc ici on a le libellé de la commune
    00:13:21
    donc ça le libellé de la commune.
    00:13:23
    Pour information,
    00:13:24
    on l'avait déjà ici donc c'est
    00:13:26
    comme une principale donc pas très
    00:13:29
    pertinent de garder cette colonne
    00:13:30
    là donc là on va le faire de
    00:13:32
    manière classique en supprimant.
    00:13:36
    Et ensuite ? On va continuer à
    00:13:41
    vérifier donc le département SK,
    00:13:43
    c'est une information
    00:13:45
    qu'on avait par ailleurs.
    00:13:47
    Un petit peu plus loin.
    00:13:51
    Voilà le département qui est ici
    00:13:53
    donc pas nécessaire de garder.
    00:13:56
    Cette colonne là ?
    00:13:58
    Vous voyez un par ailleurs que ici
    00:14:01
    les colonnes supprimées ne sont
    00:14:03
    qu'une seule étape et on voit que dans
    00:14:06
    cette feuille ici il va m'indiquer
    00:14:08
    donc ça c'est le M donc c'est le
    00:14:11
    mashup c'est en gros le code qui
    00:14:12
    est généré à chacune de mes étapes
    00:14:14
    donc je rentre pas du tout dans
    00:14:15
    le détail pour l'instant là-dessus
    00:14:16
    on aura le temps de d'en reparler
    00:14:18
    mais en tout cas ça vous permet,
    00:14:19
    si vous arrivez à le à,
    00:14:21
    le lire de savoir un petit peu
    00:14:23
    ce qui se passe dans l'état.
    00:14:25
    Donc ici,
    00:14:26
    j'ai supprimé le département et K et
    00:14:30
    après on a notre volume de participants.
    00:14:33
    2018 2017 donc là on est plutôt pas mal,
    00:14:34
    on va refaire une passe.
    00:14:35
    Le nom de la manifestation y
    00:14:36
    a pas de problème,
    00:14:37
    la région le domaine complètement,
    00:14:38
    domaine département périodicité,
    00:14:40
    mois de début, le site web,
    00:14:43
    le numéro d'identification,
    00:14:44
    la commune, le numéro de l'édition,
    00:14:46
    la date de début de la date de fin,
    00:14:48
    la date de création,
    00:14:49
    le code postal, le code INSEE,
    00:14:51
    le nom du département et les 2
    00:14:54
    volumes de participants pour 2018.
    00:14:56
    En 2017 donc,
    00:14:57
    à partir de là,
    00:14:58
    on peut considérer qu'on a supprimé
    00:15:00
    toutes les colonnes qui n'étaient
    00:15:01
    pas nécessaires pour notre projet.

    Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
    Effectuez une autre recherche ou retournez au contenu !

     

    00:00:02
    So, now that we
    00:00:03
    saves our file,
    00:00:04
    We will be able to start to realize
    00:00:06
    our first reprocessing,
    00:00:07
    So for that, once we're here,
    00:00:08
    We're going to go into transforming the data.
    00:00:11
    Transform the data that goes
    00:00:13
    allow us to display Power Quéry
    00:00:15
    and the first interesting element,
    00:00:17
    We see that there have already been steps
    00:00:18
    of reprocessing while we have
    00:00:20
    nothing asked a remember,
    00:00:21
    We just did a load of
    00:00:23
    data and that's why we did it.
    00:00:24
    It was to show you precisely
    00:00:26
    The kind of intelligence that
    00:00:28
    may be in proverbial,
    00:00:29
    So we basically what we asked for,
    00:00:31
    It is this first step that is here,
    00:00:32
    which is the data source huh.
    00:00:34
    So as a reminder,
    00:00:35
    if I click here on the toothless Pedro,
    00:00:38
    We're going to have the path
    00:00:39
    to the file if you are deceived,
    00:00:41
    Well you can click here
    00:00:42
    on browse. To do it again?
    00:00:46
    And then we'll go to navigation,
    00:00:48
    So that's normal, huh,
    00:00:49
    This is when we selected the
    00:00:51
    one to be able to work and by
    00:00:53
    Against what is interesting is
    00:00:54
    that it automatically detected the
    00:00:56
    the fact that the table included
    00:00:58
    So that's pretty good.
    00:01:00
    This is related to the fact that the the
    00:01:02
    in Excel was very well prepared
    00:01:04
    in the sense that it was declared in
    00:01:07
    as a table in Excel so this
    00:01:10
    which explains after this certain
    00:01:12
    intelligence eh since Excel
    00:01:13
    it's also Microsoft and we see
    00:01:15
    Another element is that.
    00:01:17
    He changed.
    00:01:18
    And the types of some,
    00:01:21
    certain columns,
    00:01:21
    So there on the other hand,
    00:01:23
    It will also take a little bit
    00:01:24
    be a little wary of it,
    00:01:25
    what he can deduce from certain things
    00:01:26
    who there for once are not
    00:01:29
    necessarily true so it will involve
    00:01:30
    anyway to check the type huh.
    00:01:32
    As a reminder,
    00:01:33
    The type is here on each column
    00:01:36
    to be able to change the type of the of the,
    00:01:38
    of the column and that's interesting
    00:01:40
    precisely to be able to make
    00:01:42
    sums on for example numbers,
    00:01:44
    power numbers,
    00:01:46
    calculate durations between 2 dates.
    00:01:48
    So here we will need dates.
    00:01:50
    To be able to make concatenations of
    00:01:52
    extractions via a text column,
    00:01:54
    et cetera, et cetera.
    00:01:56
    So it's a pretty important step.
    00:01:58
    so here we will say that Power
    00:02:01
    mail has done its job rather well
    00:02:03
    and we will be able to start a little
    00:02:06
    Little to continue the modifications.
    00:02:08
    So the first step that I
    00:02:10
    advises you there at the time you have
    00:02:12
    brought your first dataset,
    00:02:14
    is to sort through the columns
    00:02:16
    that you recovered when we
    00:02:19
    has crawled the file in Excel,
    00:02:20
    We saw that we potentially had
    00:02:22
    duplicates.
    00:02:22
    Things that weren't necessarily
    00:02:24
    interesting of of to keep in
    00:02:26
    the in the file and so we will
    00:02:28
    try to understand a little in which
    00:02:30
    In case columns should be deleted.
    00:02:34
    Then
    00:02:35
    Let's imagine that we are working on
    00:02:37
    of the sales data carried out
    00:02:39
    by one, by a company.
    00:02:41
    So what are the big steps of figure
    00:02:43
    in which we can say that we have
    00:02:44
    the right to finally abolish the right,
    00:02:46
    The ability to delete a column?
    00:02:48
    The first is that the data
    00:02:51
    are unnecessary for the project.
    00:02:53
    Here we are on one on one,
    00:02:57
    on a sales summary that
    00:02:59
    were carried out by a company,
    00:03:01
    to have, for example, the number
    00:03:03
    of customers' phones.
    00:03:04
    In a visualization tool,
    00:03:06
    It's not going to do me much good.
    00:03:09
    So why keep this column
    00:03:11
    there that will pollute my painting,
    00:03:13
    which will potentially increase
    00:03:15
    also my file,
    00:03:17
    so there potentially if it is
    00:03:18
    useless for what I am trying to do,
    00:03:21
    Well I can delete the column.
    00:03:24
    Note that if you are not yet
    00:03:26
    certain that the column is useful to you,
    00:03:29
    you can leave it and
    00:03:31
    later delete it, huh,
    00:03:32
    It is quite possible to make
    00:03:34
    slightly incremental deletions,
    00:03:36
    a little later in the reprocessing.
    00:03:39
    Another element,
    00:03:40
    it's duplicates,
    00:03:41
    So it happens very often to
    00:03:43
    What we often connect to
    00:03:44
    technical sources,
    00:03:46
    So it's the fact that 2
    00:03:49
    columns go up noticeably,
    00:03:50
    either exactly the same information,
    00:03:52
    or almost.
    00:03:53
    So after question of format the
    00:03:55
    same information so for example
    00:03:56
    here in the case I give these 2
    00:03:59
    columns giving the month of the sale,
    00:04:00
    there is one that is in written format,
    00:04:02
    So it would be written attached and the other format.
    00:04:04
    No it will be written 6 so there typically
    00:04:06
    It's not useful to keep the 2
    00:04:08
    huh it's the same information.
    00:04:10
    So here the most logical,
    00:04:11
    it is simply to keep the
    00:04:13
    format that suits us best,
    00:04:14
    so potentially the figure,
    00:04:16
    because I would tend to
    00:04:20
    do for and then delete
    00:04:22
    The text test column.
    00:04:24
    Give a consistent,
    00:04:26
    So here we find ourselves in a
    00:04:29
    column or in 95% of cases,
    00:04:31
    The data is not available so
    00:04:33
    Is it really relevant
    00:04:35
    to keep a column where there is also
    00:04:38
    More of as little data present
    00:04:40
    and so there in the case I give
    00:04:43
    code the code let's imagine a barcode?
    00:04:45
    The identifier is very rarely filled in
    00:04:49
    So and what I'm really going to be able to
    00:04:52
    exploit data on 5% of the lines.
    00:04:54
    Maybe not
    00:04:55
    and therefore in which case it is more
    00:04:57
    Wise to delete the column.
    00:04:59
    And the last element,
    00:05:01
    it is poor quality data,
    00:05:03
    So let's say you have a
    00:05:05
    column that is labeled Code
    00:05:06
    postal and that from time to time,
    00:05:07
    You will find rather
    00:05:09
    the name of the store,
    00:05:11
    So from time to time,
    00:05:12
    Let us even imagine in half of the cases,
    00:05:14
    or even too much,
    00:05:14
    the name of the store so it proves
    00:05:16
    a little bit of problem that
    00:05:18
    may have had around this column
    00:05:20
    there and therefore potentially even the
    00:05:22
    postal codes that are present,
    00:05:23
    which would normally be the right format,
    00:05:25
    are potentially false and therefore
    00:05:27
    Be careful it can be dangerous.
    00:05:29
    Once again
    00:05:31
    You do not have to delete the
    00:05:33
    the columns when you have a doubt,
    00:05:36
    You can do that a little later.
    00:05:37
    But overall, when you have a
    00:05:39
    little bit the answer in mind,
    00:05:41
    Well, you can directly
    00:05:43
    Delete the column.
    00:05:45
    So for that, we're going to turn around,
    00:05:47
    we're going to go to Power Quéry.
    00:05:53
    Here, that's it, we'll enjoy it elsewhere
    00:05:56
    to rename our dataset
    00:05:58
    which we will call here festival. There you go.
    00:06:05
    And we're going to be able to do a little bit
    00:06:07
    look at our dataset,
    00:06:09
    so the name of the event
    00:06:12
    I don't have a problem with that.
    00:06:14
    Neither does the region,
    00:06:16
    The domain add-in domain.
    00:06:19
    It doesn't look very full so
    00:06:21
    How I know what's a lot
    00:06:23
    filled or not filled much,
    00:06:25
    So you have this sub-bar here
    00:06:26
    which will give you a certain number
    00:06:29
    very interesting information.
    00:06:30
    So the fact that we're going to have by
    00:06:34
    example here 67% of Completion of the
    00:06:37
    of the column so in 67% of cases,
    00:06:40
    The row has a value.
    00:06:42
    He will also give us
    00:06:44
    an error indicator,
    00:06:46
    so potentially lines
    00:06:47
    that contain errors.
    00:06:48
    We will see the types of errors
    00:06:50
    that are that are possible.
    00:06:51
    And then the number of empty columns.
    00:06:54
    And that, suddenly, You see here then,
    00:06:55
    when it's green,
    00:06:56
    Well that's the,
    00:06:58
    the wholesale completion gauge of
    00:07:00
    the of the column and it does not give
    00:07:03
    Already here options to delete
    00:07:04
    for example, empty elements,
    00:07:06
    so namely the lines that are,
    00:07:08
    which are therefore obviously there,
    00:07:09
    here we go,
    00:07:10
    We're not going to do it because we have
    00:07:12
    2/3 of columns filled so that
    00:07:14
    can be quite relevant in
    00:07:15
    terms of in terms of exploitation.
    00:07:17
    Another point is important,
    00:07:19
    We see that the columns that
    00:07:21
    are initially empty in the.
    00:07:23
    In the file have here been
    00:07:25
    completed by the value zero,
    00:07:27
    So that's very important and you don't
    00:07:30
    Never find a truly empty value.
    00:07:32
    Actually
    00:07:33
    Since query power
    00:07:34
    automatically and be able to do well,
    00:07:35
    He's going to replace that with zero.
    00:07:37
    It should not be understood by a real text,
    00:07:40
    a real wording,
    00:07:41
    it's just a vision,
    00:07:44
    a way to visualize the value,
    00:07:46
    The fact that the value is empty.
    00:07:48
    But as you see,
    00:07:49
    it is in italics and therefore it
    00:07:50
    has no real value.
    00:07:52
    On the other hand, we can do everything to
    00:07:53
    makes say for example.
    00:07:54
    I delete all null values
    00:07:56
    of a column and so there suddenly it gives us
    00:07:59
    helps a lot to have an appellation
    00:08:00
    for this for the absence of value.
    00:08:04
    Then we'll have the department.
    00:08:08
    The city period,
    00:08:09
    So yes, here,
    00:08:09
    Not especially a problem.
    00:08:11
    The usual word at the beginning,
    00:08:13
    We see that there are small
    00:08:14
    school format concerns,
    00:08:14
    we were mixed with numbers and months,
    00:08:18
    but the information is relevant,
    00:08:19
    So we will see how the
    00:08:21
    Manipulate the website why not?
    00:08:23
    We will be able to exploit it.
    00:08:25
    The identification number,
    00:08:27
    So that's pretty important,
    00:08:28
    We'll keep it too.
    00:08:30
    The main municipality?
    00:08:32
    Another commune there,
    00:08:33
    This is the first case where we will
    00:08:35
    have a little more trouble
    00:08:37
    to exploit because already it will
    00:08:39
    be quite complicated to say
    00:08:40
    that on a festival we will concern
    00:08:42
    Several municipalities for example
    00:08:43
    to display on a map,
    00:08:45
    it will be much simpler
    00:08:46
    to have only one point and
    00:08:48
    In addition to that at the flyover on our ours.
    00:08:51
    Read our column,
    00:08:53
    We see that it is empty in 90% of cases,
    00:08:56
    So here we are typically on a case where it
    00:08:59
    is not relevant to keep the column,
    00:09:02
    So we will have several methods,
    00:09:04
    eh to delete a column,
    00:09:05
    the first one I show you here,
    00:09:06
    it is simply to select it,
    00:09:09
    to make a right click that will open
    00:09:11
    A whole control panel
    00:09:12
    which corresponds very broadly
    00:09:13
    what you will find,
    00:09:15
    especially in the tab of
    00:09:17
    transformation directly in in
    00:09:19
    the in power I and here we go
    00:09:22
    Just click delete.
    00:09:25
    We see that a step has just been added,
    00:09:27
    huh, here.
    00:09:30
    And so we're going to continue here
    00:09:34
    our exploration,
    00:09:35
    so the start date,
    00:09:37
    So we see that it's missing a lot,
    00:09:39
    but it's still okay
    00:09:40
    be useful for later,
    00:09:41
    Because in particular to make
    00:09:43
    representations in the time of,
    00:09:44
    of the festival volume so we will keep it.
    00:09:47
    The end date, the creation date,
    00:09:49
    the postal code very well,
    00:09:50
    Postal code and INSEE code.
    00:09:52
    So here we in our case,
    00:09:55
    I tell you,
    00:09:55
    We're mostly going to do work from
    00:09:58
    of the postal code so the INSEE code
    00:10:00
    It is something quite different.
    00:10:03
    So it's a,
    00:10:03
    This is another way of
    00:10:05
    designate a municipality and that
    00:10:07
    won't interest me too much.
    00:10:09
    So here I will rather tend to
    00:10:12
    to be deleted this column
    00:10:15
    So there of the code of the code it is.
    00:10:18
    Because it fits for more or
    00:10:20
    less for me to a duplicate of the postal code.
    00:10:23
    It's just a slightly more complicated format.
    00:10:27
    So, another method
    00:10:28
    to delete a column,
    00:10:30
    So here we will select it.
    00:10:32
    We're going to go to the reception
    00:10:33
    And we see here that we have an item.
    00:10:35
    Manage the columns and there it will
    00:10:37
    offer us 2 things so 2
    00:10:39
    choose to either abolish the school,
    00:10:41
    so delete the columns.
    00:10:41
    Bah it's pretty simple huh,
    00:10:42
    It didn't remove the
    00:10:44
    columns I select and
    00:10:46
    so FYI I can do everything
    00:10:48
    done by holding capital or
    00:10:50
    Control over my review on my keyboard
    00:10:53
    to be able to select 2 columns,
    00:10:55
    go back here and click.
    00:10:58
    Delete columns?
    00:10:59
    So what if I do this here?
    00:11:01
    So obviously, can go back.
    00:11:02
    This will be an opportunity to show you.
    00:11:05
    We see that, Well,
    00:11:06
    he deleted the les,
    00:11:09
    the 2 columns at once.
    00:11:10
    So we're going to go back.
    00:11:13
    We will go back to our insee code.
    00:11:17
    And we're going to go back here on.
    00:11:20
    The field I want to show,
    00:11:22
    so manage the deleted columns and
    00:11:23
    Now I have another option that
    00:11:25
    is delete the other columns,
    00:11:27
    So there it will have the effect
    00:11:28
    exactly reversed which is going to be
    00:11:30
    delete all Columns except
    00:11:31
    the ones I selected.
    00:11:32
    So the same we will apply but no
    00:11:34
    Panic we can go back.
    00:11:36
    So you see here,
    00:11:38
    He only kept my columns.
    00:11:42
    So we go back again.
    00:11:45
    And to show you the latest
    00:11:47
    functionality around that we
    00:11:49
    will go back to our code in C
    00:11:51
    and we're going to have the bare reverse,
    00:11:53
    i.e. choose the columns,
    00:11:54
    choose the columns,
    00:11:55
    It's going to be just to say,
    00:11:57
    Well, I choose.
    00:11:59
    The column that interests me here,
    00:12:01
    I'm going to have a field that will open,
    00:12:02
    So there, here,
    00:12:03
    I just have to unpin the potentials,
    00:12:07
    the potential columns that
    00:12:08
    I am not interested.
    00:12:10
    And so he will only go to me.
    00:12:11
    keep the one I selected
    00:12:13
    and in the same way.
    00:12:17
    If I'm looking for a column
    00:12:18
    Especially because I don't
    00:12:20
    does not find it in the list,
    00:12:21
    I will be able here for example,
    00:12:22
    Click. To my famous insee code.
    00:12:30
    So my pin code is here it
    00:12:32
    the code is left here,
    00:12:33
    I select and therefore who will
    00:12:35
    Take me directly to the column
    00:12:37
    for after potentially the
    00:12:39
    delete so here I will
    00:12:41
    Go back to my menu hop I will
    00:12:44
    Have the columns deleted.
    00:12:47
    Or not, choose the columns
    00:12:48
    Choose the columns.
    00:12:52
    And there, we see that.
    00:12:55
    The other municipalities because
    00:12:56
    that I deleted the step,
    00:12:58
    is present again,
    00:13:00
    So here I will click on
    00:13:03
    I will
    00:13:05
    Also unengage INSEE code.
    00:13:07
    I click OK.
    00:13:09
    And so there we see that I have a new item
    00:13:12
    which has just been removed.
    00:13:16
    And so we will be able to
    00:13:17
    continue our work,
    00:13:18
    So here we have the wording of the commune
    00:13:21
    So that's the wording of the commune.
    00:13:23
    For information,
    00:13:24
    We already had it here so it's
    00:13:26
    as a main so not very
    00:13:29
    relevant to keep this column
    00:13:30
    So here we are going to do it from
    00:13:32
    classic way by deleting.
    00:13:36
    What's next? We will continue to
    00:13:41
    so check the SK department,
    00:13:43
    it's information
    00:13:45
    that we had elsewhere.
    00:13:47
    A little further.
    00:13:51
    This is the department that is here
    00:13:53
    so no need to keep.
    00:13:56
    That column?
    00:13:58
    You see one elsewhere that here
    00:14:01
    Deleted columns are not
    00:14:03
    that a single step and we see that in
    00:14:06
    This sheet here he will tell me
    00:14:08
    so that's the M so it's the
    00:14:11
    mashup is basically the code that
    00:14:12
    is generated at each of my steps
    00:14:14
    so I don't fit into it at all
    00:14:15
    The detail for now on this
    00:14:16
    We'll have time to talk about it again
    00:14:18
    but in any case it allows you,
    00:14:19
    If you arrive at the at,
    00:14:21
    Read it to know a little bit
    00:14:23
    what is happening in the state.
    00:14:25
    So here,
    00:14:26
    I deleted the department and K and
    00:14:30
    Then we have our volume of participants.
    00:14:33
    2018 2017 so there we are pretty good,
    00:14:34
    We're going to make another pass.
    00:14:35
    The name of the event
    00:14:36
    has no problem,
    00:14:37
    the region the domain completely,
    00:14:38
    domain department periodicity,
    00:14:40
    start month, the website,
    00:14:43
    the identification number,
    00:14:44
    the municipality, the number of the edition,
    00:14:46
    the start date of the end date,
    00:14:48
    the date of creation,
    00:14:49
    the postal code, the INSEE code,
    00:14:51
    the name of the department and the 2
    00:14:54
    Participant volumes for 2018.
    00:14:56
    In 2017, therefore,
    00:14:57
    from there,
    00:14:58
    We can consider that we have deleted
    00:15:00
    all columns that were not
    00:15:01
    not necessary for our project.

    Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
    Effectuez une autre recherche ou retournez au contenu !

     

    00:00:02
    Jetzt, da wir
    00:00:03
    speichert unsere Datei,
    00:00:04
    Wir werden in der Lage sein, zu realisieren
    00:00:06
    unsere erste Wiederaufbereitung,
    00:00:07
    Also, wenn wir hier sind,
    00:00:08
    Wir werden uns mit der Transformation der Daten befassen.
    00:00:11
    Transformieren Sie die Daten, die
    00:00:13
    erlauben Sie uns, Power Quéry anzuzeigen
    00:00:15
    und das erste interessante Element,
    00:00:17
    Wir sehen, dass es bereits Schritte gegeben hat
    00:00:18
    der Wiederaufbereitung, während wir
    00:00:20
    Nichts fragte ein Erinnern,
    00:00:21
    Wir haben gerade eine Ladung
    00:00:23
    Daten und deshalb haben wir es getan.
    00:00:24
    Es sollte Ihnen genau zeigen
    00:00:26
    Die Art von Intelligenz, die
    00:00:28
    kann sprichwörtlich sein,
    00:00:29
    Also haben wir im Grunde das, worum wir gebeten haben,
    00:00:31
    Es ist dieser erste Schritt, der hier ist,
    00:00:32
    Das ist die Datenquelle, huh.
    00:00:34
    Also zur Erinnerung,
    00:00:35
    wenn ich hier auf den zahnlosen Pedro klicke,
    00:00:38
    Wir werden den Weg haben
    00:00:39
    in die Datei, wenn Sie getäuscht werden,
    00:00:41
    Nun, Sie können hier klicken
    00:00:42
    beim Durchsuchen. Um es noch einmal zu tun?
    00:00:46
    Und dann gehen wir zur Navigation,
    00:00:48
    Das ist also normal, hm,
    00:00:49
    Zu diesem Zeitpunkt haben wir die
    00:00:51
    eine, um arbeiten zu können und durch
    00:00:53
    Gegen das, was interessant ist, ist
    00:00:54
    dass es automatisch die
    00:00:56
    Die Tatsache, dass die Tabelle
    00:00:58
    Das ist also ziemlich gut.
    00:01:00
    Dies hängt damit zusammen, dass die die
    00:01:02
    in Excel war sehr gut vorbereitet
    00:01:04
    in dem Sinne, dass es in
    00:01:07
    als Tabelle in Excel, so dass dies
    00:01:10
    was nach diesem bestimmten
    00:01:12
    Intelligenz eh seit Excel
    00:01:13
    es ist auch Microsoft und wir sehen
    00:01:15
    Ein weiteres Element ist das.
    00:01:17
    Er hat sich verändert.
    00:01:18
    Und die Arten von einigen,
    00:01:21
    bestimmte Spalten,
    00:01:21
    Auf der anderen Seite,
    00:01:23
    Es wird auch ein wenig dauern
    00:01:24
    Sei ein wenig vorsichtig damit,
    00:01:25
    was er aus bestimmten Dingen ableiten kann
    00:01:26
    die ausnahmsweise nicht da sind
    00:01:29
    notwendigerweise wahr, so dass es beinhaltet
    00:01:30
    Wie auch immer, um den Typ zu überprüfen, huh.
    00:01:32
    Zur Erinnerung:
    00:01:33
    Der Typ befindet sich hier in jeder Spalte
    00:01:36
    um die Art der der
    00:01:38
    der Kolumne und das ist interessant
    00:01:40
    genau in der Lage zu sein,
    00:01:42
    summiert sich z.B. auf Zahlen,
    00:01:44
    Leistungsnummern,
    00:01:46
    Berechnen Sie die Dauer zwischen 2 Daten.
    00:01:48
    Hier brauchen wir also Termine.
    00:01:50
    Verkettungen von
    00:01:52
    Extraktionen über eine Textspalte,
    00:01:54
    et cetera, et cetera.
    00:01:56
    Es ist also ein ziemlich wichtiger Schritt.
    00:01:58
    also hier werden wir sagen, dass Macht
    00:02:01
    Die Post hat ihre Arbeit ziemlich gut gemacht
    00:02:03
    und wir werden ein wenig anfangen können
    00:02:06
    Wenig, um die Änderungen fortzusetzen.
    00:02:08
    Der erste Schritt, den ich
    00:02:10
    berät Sie dort zu dem Zeitpunkt, zu dem Sie
    00:02:12
    brachte Ihren ersten Datensatz mit,
    00:02:14
    ist es, die Spalten zu sortieren
    00:02:16
    dass Sie sich erholt haben, als wir
    00:02:19
    die Datei in Excel gecrawlt hat,
    00:02:20
    Wir sahen, dass wir potentiell
    00:02:22
    Duplikate.
    00:02:22
    Dinge, die nicht unbedingt waren
    00:02:24
    interessant von von in zu halten
    00:02:26
    die in der Datei und so werden wir
    00:02:28
    Versuchen Sie, ein wenig zu verstehen, in dem
    00:02:30
    Für den Fall, dass Spalten gelöscht werden sollen.
    00:02:34
    Dann
    00:02:35
    Stellen wir uns vor, wir arbeiten an
    00:02:37
    der durchgeführten Verkaufsdaten
    00:02:39
    von einem, von einem Unternehmen.
    00:02:41
    Also, was sind die großen Schritte der Figur
    00:02:43
    in dem wir sagen können, dass wir
    00:02:44
    das Recht, das Recht endgültig abzuschaffen,
    00:02:46
    Die Möglichkeit, eine Spalte zu löschen?
    00:02:48
    Die erste ist, dass die Daten
    00:02:51
    sind für das Projekt unnötig.
    00:02:53
    Hier sind wir eins zu eins,
    00:02:57
    auf einer Verkaufszusammenfassung, die
    00:02:59
    von einem Unternehmen durchgeführt wurden,
    00:03:01
    um z.B. die Nummer
    00:03:03
    der Telefone der Kunden.
    00:03:04
    In einem Visualisierungstool
    00:03:06
    Es wird mir nicht viel nützen.
    00:03:09
    Warum also diese Kolumne behalten
    00:03:11
    dort, das meine Malerei verschmutzen wird,
    00:03:13
    die möglicherweise zunehmen wird
    00:03:15
    auch meine Datei,
    00:03:17
    also gibt es potentiell, wenn es
    00:03:18
    nutzlos für das, was ich zu tun versuche,
    00:03:21
    Nun, ich kann die Spalte löschen.
    00:03:24
    Beachten Sie, dass, wenn Sie noch nicht sind,
    00:03:26
    sicher, dass die Kolumne für Sie nützlich ist,
    00:03:29
    Sie können es lassen und
    00:03:31
    später löschen, hm,
    00:03:32
    Es ist durchaus möglich,
    00:03:34
    leicht inkrementelle Löschungen,
    00:03:36
    etwas später in der Wiederaufbereitung.
    00:03:39
    Ein weiteres Element,
    00:03:40
    es sind Duplikate,
    00:03:41
    So kommt es sehr oft vor,
    00:03:43
    Womit wir uns oft verbinden
    00:03:44
    technische Quellen,
    00:03:46
    Es ist also die Tatsache, dass 2
    00:03:49
    Spalten gehen merklich nach oben,
    00:03:50
    entweder genau die gleichen Informationen,
    00:03:52
    oder fast.
    00:03:53
    Nach der Frage des Formats ist die
    00:03:55
    Gleiche Informationen, also zum Beispiel
    00:03:56
    hier in dem Fall gebe ich diese 2
    00:03:59
    Spalten mit Angabe des Verkaufsmonats,
    00:04:00
    es gibt eine, die in schriftlicher Form vorliegt,
    00:04:02
    So würde es geschrieben werden angehängt und das andere Format.
    00:04:04
    Nein, es wird 6 geschrieben, also gibt es typischerweise
    00:04:06
    Es ist nicht sinnvoll, die 2
    00:04:08
    huh es sind die gleichen Informationen.
    00:04:10
    Also hier die logischste,
    00:04:11
    Es geht einfach darum, die
    00:04:13
    Format, das am besten zu uns passt,
    00:04:14
    also potentiell die Figur,
    00:04:16
    weil ich dazu tendieren würde,
    00:04:20
    Ausführen für und anschließendes Löschen
    00:04:22
    Die Texttestspalte.
    00:04:24
    Geben Sie eine konsistente,
    00:04:26
    Hier befinden wir uns also in einer
    00:04:29
    Spalte oder in 95% der Fälle,
    00:04:31
    Die Daten sind nicht verfügbar, so dass
    00:04:33
    Ist es wirklich relevant?
    00:04:35
    , um eine Spalte beizubehalten, in der sich auch
    00:04:38
    Mehr von so wenig Daten vorhanden
    00:04:40
    und so gibt es in dem Fall, den ich gebe
    00:04:43
    Code den Code Stellen wir uns einen Barcode vor?
    00:04:45
    Der Identifikator wird sehr selten ausgefüllt
    00:04:49
    So und was ich wirklich können werde
    00:04:52
    Nutzen Sie Daten auf 5% der Leitungen.
    00:04:54
    Vielleicht nicht
    00:04:55
    und daher ist es in diesem Fall mehr
    00:04:57
    Es ist ratsam, die Spalte zu löschen.
    00:04:59
    Und das letzte Element,
    00:05:01
    es handelt sich um Daten von schlechter Qualität,
    00:05:03
    Nehmen wir also an, Sie haben eine
    00:05:05
    Spalte mit der Bezeichnung Code
    00:05:06
    Post und das von Zeit zu Zeit,
    00:05:07
    Sie werden eher
    00:05:09
    den Namen des Geschäfts,
    00:05:11
    Also von Zeit zu Zeit,
    00:05:12
    Stellen wir uns sogar vor, in der Hälfte der Fälle,
    00:05:14
    oder sogar zu viel,
    00:05:14
    der Name des Ladens, so beweist es
    00:05:16
    ein kleines Problem, das
    00:05:18
    könnte um diese Kolumne herum gehabt haben
    00:05:20
    dort und damit potentiell sogar die
    00:05:22
    vorhandene Postleitzahlen,
    00:05:23
    welches normalerweise das richtige Format wäre,
    00:05:25
    sind potentiell falsch und daher
    00:05:27
    Seien Sie vorsichtig, es kann gefährlich sein.
    00:05:29
    Noch einmal
    00:05:31
    Sie müssen die
    00:05:33
    die Spalten, wenn Sie Zweifel haben,
    00:05:36
    Sie können das etwas später tun.
    00:05:37
    Aber insgesamt, wenn Sie eine
    00:05:39
    ein bisschen die Antwort im Kopf,
    00:05:41
    Nun, Sie können direkt
    00:05:43
    Löschen Sie die Spalte.
    00:05:45
    Dafür werden wir uns umdrehen,
    00:05:47
    Wir gehen zu Power Quéry.
    00:05:53
    Hier, das war's, wir werden es anderswo genießen
    00:05:56
    So benennen Sie unseren Datensatz um
    00:05:58
    die wir hier Festival nennen werden. Bitte schön.
    00:06:05
    Und wir werden in der Lage sein, ein bisschen zu tun
    00:06:07
    Schauen Sie sich unseren Datensatz an,
    00:06:09
    also der Name der Veranstaltung
    00:06:12
    Damit habe ich kein Problem.
    00:06:14
    Auch die Region nicht,
    00:06:16
    Die Domänen-Add-In-Domäne.
    00:06:19
    Es sieht nicht sehr voll aus, also
    00:06:21
    Woher ich weiß, was viel ist
    00:06:23
    gefüllt oder nicht viel gefüllt,
    00:06:25
    Sie haben also diese Unterleiste hier
    00:06:26
    was Ihnen eine bestimmte Nummer gibt
    00:06:29
    Sehr interessante Informationen.
    00:06:30
    Die Tatsache, dass wir durch
    00:06:34
    Beispiel hier 67% der Fertigstellung der
    00:06:37
    der Spalte so in 67% der Fälle,
    00:06:40
    Die Zeile hat einen Wert.
    00:06:42
    Er wird uns auch geben
    00:06:44
    ein Fehlerindikator,
    00:06:46
    so potentiell Linien
    00:06:47
    die Fehler enthalten.
    00:06:48
    Wir werden die Arten von Fehlern sehen
    00:06:50
    die möglich sind.
    00:06:51
    Und dann die Anzahl der leeren Spalten.
    00:06:54
    Und das plötzlich siehst Du hier dann,
    00:06:55
    wenn es grün ist,
    00:06:56
    Nun, das ist das,
    00:06:58
    das Großhandels-Fertigstellungsmaß von
    00:07:00
    die der Spalte und es gibt nicht
    00:07:03
    Bereits hier Optionen zum Löschen
    00:07:04
    z. B. leere Elemente,
    00:07:06
    also nämlich die Linien, die sind,
    00:07:08
    die daher offensichtlich vorhanden sind,
    00:07:09
    Los geht es
    00:07:10
    Wir werden es nicht tun, weil wir
    00:07:12
    2/3 der Spalten gefüllt, so dass
    00:07:14
    kann sehr relevant sein in
    00:07:15
    Bedingungen in Bezug auf die Nutzung.
    00:07:17
    Ein weiterer Punkt ist wichtig,
    00:07:19
    Wir sehen, dass die Spalten, die
    00:07:21
    sind zunächst leer in der.
    00:07:23
    In der Datei wurden hier
    00:07:25
    ergänzt durch den Wert Null,
    00:07:27
    Das ist also sehr wichtig und Sie tun es nicht
    00:07:30
    Finden Sie niemals einen wirklich leeren Wert.
    00:07:32
    Tatsächlich
    00:07:33
    Seit der Abfrageleistung
    00:07:34
    automatisch und in der Lage sein, es gut zu machen,
    00:07:35
    Er wird das durch Null ersetzen.
    00:07:37
    Es sollte nicht durch einen echten Text verstanden werden,
    00:07:40
    eine echte Formulierung,
    00:07:41
    Es ist nur eine Vision,
    00:07:44
    eine Möglichkeit, den Wert zu visualisieren,
    00:07:46
    Die Tatsache, dass der Wert leer ist.
    00:07:48
    Aber wie Sie sehen,
    00:07:49
    Es ist kursiv und daher ist es
    00:07:50
    hat keinen wirklichen Wert.
    00:07:52
    Auf der anderen Seite können wir alles tun, um
    00:07:53
    macht zum Beispiel zu sagen.
    00:07:54
    Ich lösche alle Nullwerte
    00:07:56
    einer Säule und so gibt es uns plötzlich
    00:07:59
    hilft sehr, eine Appellation zu haben
    00:08:00
    für die Abwesenheit von Wert.
    00:08:04
    Dann haben wir die Abteilung.
    00:08:08
    Die Stadtzeit,
    00:08:09
    Also ja, hier,
    00:08:09
    Kein besonderes Problem.
    00:08:11
    Das übliche Wort am Anfang,
    00:08:13
    Wir sehen, dass es kleine
    00:08:14
    Anliegen des Schulformats,
    00:08:14
    Wir waren gemischt mit Zahlen und Monaten,
    00:08:18
    aber die Informationen relevant sind,
    00:08:19
    Wir werden also sehen, wie die
    00:08:21
    Manipulieren Sie die Website, warum nicht?
    00:08:23
    Wir werden in der Lage sein, sie auszunutzen.
    00:08:25
    die Identifikationsnummer,
    00:08:27
    Das ist also ziemlich wichtig,
    00:08:28
    Wir werden es auch behalten.
    00:08:30
    Die Hauptgemeinde?
    00:08:32
    Eine andere Gemeinde dort,
    00:08:33
    Dies ist der erste Fall, in dem wir
    00:08:35
    haben ein wenig mehr Ärger
    00:08:37
    zu nutzen, weil es bereits
    00:08:39
    ziemlich kompliziert zu sagen sein
    00:08:40
    dass wir uns auf einem Festival beschäftigen werden
    00:08:42
    Mehrere Gemeinden zum Beispiel
    00:08:43
    , um auf einer Karte anzuzeigen,
    00:08:45
    Es wird viel einfacher sein
    00:08:46
    nur einen Punkt zu haben und
    00:08:48
    Zusätzlich dazu bei der Überführung auf unserer.
    00:08:51
    Lesen Sie unsere Kolumne,
    00:08:53
    Wir sehen, dass es in 90% der Fälle leer ist,
    00:08:56
    Hier sind wir also typischerweise in einem Fall, in dem es
    00:08:59
    für die Beibehaltung der Spalte nicht relevant ist,
    00:09:02
    Wir werden also mehrere Methoden haben,
    00:09:04
    eh um eine Spalte zu löschen,
    00:09:05
    den ersten zeige ich dir hier,
    00:09:06
    es ist einfach, es auszuwählen,
    00:09:09
    , um einen Rechtsklick zu machen, der geöffnet wird
    00:09:11
    Ein ganzes Bedienfeld
    00:09:12
    was sehr weitgehend entspricht
    00:09:13
    was Sie finden werden,
    00:09:15
    insbesondere im Tab von
    00:09:17
    Transformation direkt in in
    00:09:19
    die in der Macht I und los geht's
    00:09:22
    Klicken Sie einfach auf Löschen.
    00:09:25
    Wir sehen, dass gerade ein Schritt hinzugefügt wurde,
    00:09:27
    Hm, hier.
    00:09:30
    Und so geht es hier weiter
    00:09:34
    unsere Erkundung,
    00:09:35
    also das Startdatum,
    00:09:37
    Wir sehen also, dass es viel fehlt,
    00:09:39
    aber es ist immer noch okay
    00:09:40
    für später nützlich sein,
    00:09:41
    Denn insbesondere zu machen
    00:09:43
    Vertretungen in der Zeit von,
    00:09:44
    des Festivalvolumens, also werden wir es behalten.
    00:09:47
    Das Enddatum, das Erstellungsdatum,
    00:09:49
    die Postleitzahl sehr gut,
    00:09:50
    Postleitzahl und INSEE-Code.
    00:09:52
    Also hier sind wir in unserem Fall,
    00:09:55
    Ich sage euch,
    00:09:55
    Wir werden hauptsächlich von
    00:09:58
    der Postleitzahl, also des INSEE-Codes
    00:10:00
    Es ist etwas ganz anderes.
    00:10:03
    Es ist also ein,
    00:10:03
    Dies ist eine andere Möglichkeit,
    00:10:05
    eine Gemeinde bezeichnen und dass
    00:10:07
    wird mich nicht allzu sehr interessieren.
    00:10:09
    Also hier werde ich eher dazu tendieren,
    00:10:12
    So löschen Sie diese Spalte
    00:10:15
    Es gibt also den Code des Codes.
    00:10:18
    Weil es für mehr oder mehr passt
    00:10:20
    weniger für mich zu einem Duplikat der Postleitzahl.
    00:10:23
    Es ist nur ein etwas komplizierteres Format.
    00:10:27
    Also, eine andere Methode
    00:10:28
    , um eine Spalte zu löschen,
    00:10:30
    Also hier werden wir es auswählen.
    00:10:32
    Wir gehen zur Rezeption
    00:10:33
    Und wir sehen hier, dass wir einen Gegenstand haben.
    00:10:35
    Verwalten Sie die Spalten und dort wird es
    00:10:37
    Bieten Sie uns 2 Dinge so 2
    00:10:39
    entweder die Schule abschaffen,
    00:10:41
    Löschen Sie also die Spalten.
    00:10:41
    Bah es ist ziemlich einfach, huh,
    00:10:42
    Die
    00:10:44
    Spalten, die ich auswähle und
    00:10:46
    also FYI Ich kann alles tun
    00:10:48
    durch Kapitalbeteiligung oder
    00:10:50
    Kontrolle über meine Bewertung auf meiner Tastatur
    00:10:53
    um 2 Spalten auswählen zu können,
    00:10:55
    Gehen Sie zurück hierher und klicken Sie.
    00:10:58
    Spalten löschen?
    00:10:59
    Was ist, wenn ich das hier mache?
    00:11:01
    Also offensichtlich, kann zurückgehen.
    00:11:02
    Dies wird eine Gelegenheit sein, es Ihnen zu zeigen.
    00:11:05
    Wir sehen, dass, Nun,
    00:11:06
    Er löschte die LEs,
    00:11:09
    Die 2 Spalten auf einmal.
    00:11:10
    Also gehen wir zurück.
    00:11:13
    Wir werden zu unserem Insee-Code zurückkehren.
    00:11:17
    Und wir werden hierher zurückkehren.
    00:11:20
    Das Feld, das ich zeigen möchte,
    00:11:22
    Verwalten Sie also die gelöschten Spalten und
    00:11:23
    Jetzt habe ich eine weitere Option, die
    00:11:25
    die anderen Spalten löschen,
    00:11:27
    Dort wird es also den Effekt haben
    00:11:28
    genau umgekehrt, was sein wird
    00:11:30
    Löschen Sie alle Spalten außer
    00:11:31
    die, die ich ausgewählt habe.
    00:11:32
    Also das gleiche werden wir anwenden, aber keine
    00:11:34
    Panik können wir zurückgehen.
    00:11:36
    So sehen Sie hier,
    00:11:38
    Er behielt nur meine Kolumnen.
    00:11:42
    Also gehen wir wieder zurück.
    00:11:45
    Und um Ihnen die neuesten
    00:11:47
    Funktionalität rund um die wir
    00:11:49
    wird zu unserem Code in C zurückkehren
    00:11:51
    und wir werden das nackte Gegenteil haben,
    00:11:53
    d.h. wählen Sie die Spalten aus,
    00:11:54
    Wählen Sie die Spalten aus,
    00:11:55
    Es wird nur sein, um zu sagen,
    00:11:57
    Nun, ich wähle.
    00:11:59
    Die Kolumne, die mich hier interessiert,
    00:12:01
    Ich werde ein Feld haben, das sich öffnen wird,
    00:12:02
    Also da, hier,
    00:12:03
    Ich muss nur die Potenziale lösen,
    00:12:07
    die potenziellen Spalten, die
    00:12:08
    Ich bin nicht interessiert.
    00:12:10
    Und so wird er nur zu mir gehen.
    00:12:11
    Behalten Sie diejenige bei, die ich ausgewählt habe
    00:12:13
    und auf die gleiche Weise.
    00:12:17
    Wenn ich nach einer Kolumne suche
    00:12:18
    Vor allem, weil ich es nicht tue
    00:12:20
    findet es nicht in der Liste,
    00:12:21
    Ich werde hier zum Beispiel in der Lage sein,
    00:12:22
    Klicken. Zu meinem berühmten Insee-Code.
    00:12:30
    Mein PIN-Code ist also hier
    00:12:32
    Der Code wird hier hinterlassen,
    00:12:33
    Ich wähle aus und daher wer wird
    00:12:35
    Bringen Sie mich direkt zur Kolumne
    00:12:37
    für nach potentiell die
    00:12:39
    löschen, also werde ich hier
    00:12:41
    Gehen Sie zurück zu meinem Menühop Ich werde
    00:12:44
    Lassen Sie die Spalten löschen.
    00:12:47
    Oder nicht, wählen Sie die Spalten
    00:12:48
    Wählen Sie die Spalten aus.
    00:12:52
    Und dort sehen wir das.
    00:12:55
    Die anderen Gemeinden, weil
    00:12:56
    dass ich den Schritt gelöscht habe,
    00:12:58
    wieder anwesend ist,
    00:13:00
    Also hier klicke ich auf
    00:13:03
    Ich werde
    00:13:05
    Deaktivieren Sie auch den INSEE-Code.
    00:13:07
    Ich klicke auf OK.
    00:13:09
    Und da sehen wir, dass ich einen neuen Artikel habe
    00:13:12
    die gerade entfernt wurde.
    00:13:16
    Und so werden wir in der Lage sein,
    00:13:17
    unsere Arbeit fortsetzen,
    00:13:18
    Hier haben wir also den Wortlaut der Kommune
    00:13:21
    Das ist also der Wortlaut der Kommune.
    00:13:23
    Zur Information:
    00:13:24
    Wir hatten es bereits hier, also ist es
    00:13:26
    als Haupt so nicht sehr
    00:13:29
    Relevant für die Beibehaltung dieser Spalte
    00:13:30
    Also hier werden wir es tun von
    00:13:32
    klassischer Weg durch Löschen.
    00:13:36
    Was kommt als nächstes? Wir werden weiterhin
    00:13:41
    also überprüfen Sie die SK-Abteilung,
    00:13:43
    Es ist Information
    00:13:45
    die wir anderswo hatten.
    00:13:47
    Etwas weiter.
    00:13:51
    Dies ist die Abteilung, die hier ist
    00:13:53
    Also keine Notwendigkeit zu behalten.
    00:13:56
    Diese Kolumne?
    00:13:58
    Sie sehen einen anderswo, der hier
    00:14:01
    Gelöschte Spalten sind nicht
    00:14:03
    Das ist ein einziger Schritt, und wir sehen das in
    00:14:06
    Dieses Blatt hier wird er mir sagen
    00:14:08
    das ist also das M, also ist es das
    00:14:11
    Mashup ist im Grunde der Code, der
    00:14:12
    wird bei jedem meiner Schritte generiert
    00:14:14
    also passe ich überhaupt nicht hinein
    00:14:15
    Die Details für jetzt zu diesem
    00:14:16
    Wir werden Zeit haben, noch einmal darüber zu sprechen
    00:14:18
    aber auf jeden Fall erlaubt es Ihnen,
    00:14:19
    Wenn Sie am at ankommen,
    00:14:21
    Lesen Sie es, um ein wenig zu wissen
    00:14:23
    was im Staat passiert.
    00:14:25
    Also hier,
    00:14:26
    Ich habe die Abteilung gelöscht und K und
    00:14:30
    Dann haben wir unser Teilnehmervolumen.
    00:14:33
    2018 2017 Da sind wir also ziemlich gut,
    00:14:34
    Wir werden einen weiteren Pass machen.
    00:14:35
    Der Name der Veranstaltung
    00:14:36
    hat kein Problem,
    00:14:37
    die Region die Domäne vollständig,
    00:14:38
    Periodizität der Domänenabteilung,
    00:14:40
    Startmonat, die Website,
    00:14:43
    die Kennnummer,
    00:14:44
    die Gemeinde, die Nummer der Ausgabe,
    00:14:46
    das Anfangsdatum des Enddatums,
    00:14:48
    das Datum der Erstellung,
    00:14:49
    die Postleitzahl, den INSEE-Code,
    00:14:51
    den Namen der Abteilung und die 2
    00:14:54
    Teilnehmerzahlen für 2018.
    00:14:56
    Im Jahr 2017 wird daher
    00:14:57
    daher
    00:14:58
    Wir können davon ausgehen, dass wir gelöscht haben
    00:15:00
    alle Spalten, die nicht
    00:15:01
    nicht notwendig für unser Projekt.

    Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
    Effectuez une autre recherche ou retournez au contenu !

     

    00:00:02
    Entonces, ahora que
    00:00:03
    guarda nuestro archivo,
    00:00:04
    Podremos empezar a darnos cuenta
    00:00:06
    nuestro primer reprocesamiento,
    00:00:07
    Así que para eso, una vez que estemos aquí,
    00:00:08
    Vamos a entrar en la transformación de los datos.
    00:00:11
    Transforme los datos que van
    00:00:13
    permitirnos mostrar Power Query
    00:00:15
    y el primer elemento interesante,
    00:00:17
    Vemos que ya ha habido pasos
    00:00:18
    de reprocesamiento mientras tenemos
    00:00:20
    nada pidió un recuerdo,
    00:00:21
    Acabamos de hacer un montón de
    00:00:23
    y por eso lo hicimos.
    00:00:24
    Fue para mostrarte precisamente
    00:00:26
    El tipo de inteligencia que
    00:00:28
    puede estar en proverbial,
    00:00:29
    Así que básicamente lo que pedimos,
    00:00:31
    Es este primer paso el que está aquí,
    00:00:32
    que es la fuente de datos eh.
    00:00:34
    Así que como recordatorio,
    00:00:35
    si hago clic aquí en el desdentado Pedro,
    00:00:38
    Vamos a tener el camino
    00:00:39
    al archivo si es engañado,
    00:00:41
    Pues puedes hacer clic aquí
    00:00:42
    en navegar. ¿Para hacerlo de nuevo?
    00:00:46
    Y luego iremos a la navegación,
    00:00:48
    Así que eso es normal, eh,
    00:00:49
    Aquí es cuando seleccionamos el
    00:00:51
    uno para poder trabajar y por
    00:00:53
    Contra lo que es interesante es
    00:00:54
    que detectó automáticamente el
    00:00:56
    el hecho de que la tabla incluyera
    00:00:58
    Así que eso es bastante bueno.
    00:01:00
    Esto está relacionado con el hecho de que el
    00:01:02
    en Excel estaba muy bien preparado
    00:01:04
    en el sentido de que se declaró en
    00:01:07
    como una tabla en Excel para que esto
    00:01:10
    lo que explica después de este cierto
    00:01:12
    inteligencia eh desde Excel
    00:01:13
    también es Microsoft y vemos
    00:01:15
    Otro elemento es ese.
    00:01:17
    Él cambió.
    00:01:18
    Y los tipos de algunos,
    00:01:21
    determinadas columnas,
    00:01:21
    Así que allí, por otro lado,
    00:01:23
    También tomará un poco
    00:01:24
    ten un poco de cuidado con eso,
    00:01:25
    Lo que puede deducir de ciertas cosas
    00:01:26
    que por una vez no están
    00:01:29
    necesariamente cierto por lo que implicará
    00:01:30
    De todos modos para comprobar el tipo eh.
    00:01:32
    Como recordatorio,
    00:01:33
    El tipo está aquí en cada columna
    00:01:36
    para poder cambiar el tipo de la,
    00:01:38
    de la columna y eso es interesante
    00:01:40
    precisamente para poder hacer
    00:01:42
    sumas sobre, por ejemplo, números,
    00:01:44
    números de potencia,
    00:01:46
    Calcula duraciones entre 2 fechas.
    00:01:48
    Así que aquí necesitaremos fechas.
    00:01:50
    Poder hacer concatenaciones de
    00:01:52
    extracciones a través de una columna de texto,
    00:01:54
    etcétera, etcétera.
    00:01:56
    Así que es un paso bastante importante.
    00:01:58
    así que aquí diremos que el Poder
    00:02:01
    El correo ha hecho su trabajo bastante bien
    00:02:03
    y podremos empezar un poco
    00:02:06
    Poco para continuar las modificaciones.
    00:02:08
    Así que el primer paso que yo
    00:02:10
    te aconseja allí en el momento que tienes
    00:02:12
    trajo su primer conjunto de datos,
    00:02:14
    es ordenar las columnas
    00:02:16
    que recuperaste cuando
    00:02:19
    ha rastreado el archivo en Excel,
    00:02:20
    Vimos que potencialmente teníamos
    00:02:22
    Duplicados.
    00:02:22
    Cosas que no eran necesariamente
    00:02:24
    interesante de de mantener en
    00:02:26
    el en el archivo y así lo haremos
    00:02:28
    Trate de entender un poco en el que
    00:02:30
    En caso de que las columnas deban eliminarse.
    00:02:34
    Entonces
    00:02:35
    Imaginemos que estamos trabajando en
    00:02:37
    de los datos de ventas realizados
    00:02:39
    por uno, por una empresa.
    00:02:41
    Entonces, ¿cuáles son los grandes pasos de la figura?
    00:02:43
    en el que podemos decir que tenemos
    00:02:44
    el derecho a abolir definitivamente el derecho,
    00:02:46
    ¿La capacidad de eliminar una columna?
    00:02:48
    La primera es que los datos
    00:02:51
    son innecesarios para el proyecto.
    00:02:53
    Aquí estamos en uno a uno,
    00:02:57
    en un resumen de ventas que
    00:02:59
    hayan sido realizadas por una empresa,
    00:03:01
    tener, por ejemplo, el número
    00:03:03
    de los teléfonos de los clientes.
    00:03:04
    En una herramienta de visualización,
    00:03:06
    No me va a hacer mucho bien.
    00:03:09
    Entonces, ¿por qué mantener esta columna?
    00:03:11
    allí que contaminará mi pintura,
    00:03:13
    que potencialmente aumentará
    00:03:15
    también mi archivo,
    00:03:17
    así que potencialmente si es
    00:03:18
    inútil para lo que estoy tratando de hacer,
    00:03:21
    Bueno, puedo eliminar la columna.
    00:03:24
    Tenga en cuenta que si aún no lo ha hecho
    00:03:26
    seguro de que la columna es útil para usted,
    00:03:29
    puedes dejarlo y
    00:03:31
    más tarde elimínelo, eh,
    00:03:32
    Es muy posible hacer
    00:03:34
    eliminaciones ligeramente incrementales,
    00:03:36
    un poco más tarde en el reprocesamiento.
    00:03:39
    Otro elemento,
    00:03:40
    son duplicados,
    00:03:41
    Así que sucede muy a menudo a
    00:03:43
    A lo que a menudo nos conectamos
    00:03:44
    fuentes técnicas,
    00:03:46
    Así que es el hecho de que 2
    00:03:49
    las columnas suben notablemente,
    00:03:50
    o bien exactamente la misma información,
    00:03:52
    o casi.
    00:03:53
    Entonces, después de la cuestión del formato, el
    00:03:55
    misma información, por ejemplo,
    00:03:56
    aquí en el caso doy estos 2
    00:03:59
    columnas que indiquen el mes de la venta,
    00:04:00
    hay uno que está en formato escrito,
    00:04:02
    Así que se escribiría adjunto y el otro formato.
    00:04:04
    No, se escribirá 6, por lo que normalmente hay
    00:04:06
    No es útil mantener el 2
    00:04:08
    Eh, es la misma información.
    00:04:10
    Así que aquí lo más lógico,
    00:04:11
    es simplemente mantener el
    00:04:13
    formato que más nos convenga,
    00:04:14
    así que potencialmente la figura,
    00:04:16
    porque tendería a
    00:04:20
    Hacer para y, a continuación, eliminar
    00:04:22
    La columna de prueba de texto.
    00:04:24
    Dar un consistente,
    00:04:26
    Así que aquí nos encontramos en un
    00:04:29
    o en el 95% de los casos,
    00:04:31
    Los datos no están disponibles, por lo que
    00:04:33
    ¿Es realmente relevante?
    00:04:35
    para mantener una columna donde también hay
    00:04:38
    Más de tan pocos datos presentes
    00:04:40
    y así que ahí en el caso que doy
    00:04:43
    Codificar el código ¿Imaginemos un código de barras?
    00:04:45
    El identificador rara vez se rellena
    00:04:49
    Entonces, y lo que realmente voy a poder
    00:04:52
    Explotar datos en el 5% de las líneas.
    00:04:54
    Quizá no
    00:04:55
    y, por lo tanto, en cuyo caso es más
    00:04:57
    Es prudente eliminar la columna.
    00:04:59
    Y el último elemento,
    00:05:01
    son datos de mala calidad,
    00:05:03
    Así que digamos que tienes un
    00:05:05
    columna etiquetada como Código
    00:05:06
    postal y que de vez en cuando,
    00:05:07
    Encontrarás más bien
    00:05:09
    el nombre de la tienda,
    00:05:11
    Así que de vez en cuando,
    00:05:12
    Imaginemos incluso en la mitad de los casos,
    00:05:14
    o incluso demasiado,
    00:05:14
    el nombre de la tienda para que demuestre
    00:05:16
    un poco de problema que
    00:05:18
    puede haber tenido alrededor de esta columna
    00:05:20
    allí y, por lo tanto, potencialmente incluso el
    00:05:22
    códigos postales que están presentes,
    00:05:23
    que normalmente sería el formato correcto,
    00:05:25
    son potencialmente falsos y, por lo tanto,
    00:05:27
    Tenga cuidado de que puede ser peligroso.
    00:05:29
    Otra vez
    00:05:31
    No es necesario eliminar el
    00:05:33
    las columnas cuando tienes una duda,
    00:05:36
    Puedes hacerlo un poco más tarde.
    00:05:37
    Pero en general, cuando tienes un
    00:05:39
    Un poco la respuesta en mente,
    00:05:41
    Bueno, puedes directamente
    00:05:43
    Elimine la columna.
    00:05:45
    Así que para eso, vamos a dar la vuelta,
    00:05:47
    vamos a ir a Power Query.
    00:05:53
    Aquí, eso es todo, lo disfrutaremos en otro lugar
    00:05:56
    Para cambiar el nombre de nuestro conjunto de datos
    00:05:58
    que llamaremos aquí festival. Aquí tienes.
    00:06:05
    Y vamos a ser capaces de hacer un poco
    00:06:07
    mire nuestro conjunto de datos,
    00:06:09
    Así que el nombre del evento
    00:06:12
    No tengo ningún problema con eso.
    00:06:14
    Tampoco lo hace la región,
    00:06:16
    El dominio del complemento de dominio.
    00:06:19
    No se ve muy lleno, así que
    00:06:21
    Cómo sé lo que es mucho
    00:06:23
    llenado o no llenado mucho,
    00:06:25
    Así que tienes esta subbarra aquí
    00:06:26
    que le dará un cierto número
    00:06:29
    Información muy interesante.
    00:06:30
    Así que el hecho de que vamos a tener por
    00:06:34
    ejemplo aquí 67% de Finalización de la
    00:06:37
    de la columna en el 67% de los casos,
    00:06:40
    La fila tiene un valor.
    00:06:42
    Él también nos dará
    00:06:44
    un indicador de error,
    00:06:46
    así que potencialmente líneas
    00:06:47
    que contienen errores.
    00:06:48
    Veremos los tipos de errores
    00:06:50
    que son los que son posibles.
    00:06:51
    Y luego el número de columnas vacías.
    00:06:54
    Y que, de repente, ves aquí entonces,
    00:06:55
    cuando es verde,
    00:06:56
    Bueno, ese es el,
    00:06:58
    el indicador de finalización al por mayor de
    00:07:00
    el de la columna y no da
    00:07:03
    Ya aquí hay opciones para eliminar
    00:07:04
    por ejemplo, elementos vacíos,
    00:07:06
    así que las líneas que son,
    00:07:08
    que, por lo tanto, obviamente existen,
    00:07:09
    Aquí vamos
    00:07:10
    No lo vamos a hacer porque tenemos
    00:07:12
    2/3 de columnas llenas para que
    00:07:14
    puede ser bastante relevante en
    00:07:15
    términos de en términos de explotación.
    00:07:17
    Otro punto es importante,
    00:07:19
    Vemos que las columnas que
    00:07:21
    están inicialmente vacíos en el.
    00:07:23
    En el archivo han estado aquí
    00:07:25
    completado por el valor cero,
    00:07:27
    Así que eso es muy importante y no lo haces.
    00:07:30
    Nunca encuentres un valor verdaderamente vacío.
    00:07:32
    Realmente
    00:07:33
    Desde el poder de consulta
    00:07:34
    automáticamente y poder hacerlo bien,
    00:07:35
    Él va a reemplazar eso con cero.
    00:07:37
    No debe entenderse por un texto real,
    00:07:40
    una redacción real,
    00:07:41
    es solo una visión,
    00:07:44
    una forma de visualizar el valor,
    00:07:46
    El hecho de que el valor esté vacío.
    00:07:48
    Pero como ves,
    00:07:49
    Está en cursiva y, por lo tanto,
    00:07:50
    no tiene valor real.
    00:07:52
    Por otro lado, podemos hacer todo lo posible para
    00:07:53
    hace decir por ejemplo.
    00:07:54
    Elimino todos los valores nulos
    00:07:56
    de una columna y así de repente nos da
    00:07:59
    Ayuda mucho a tener una denominación
    00:08:00
    para esto por la ausencia de valor.
    00:08:04
    Luego tendremos el departamento.
    00:08:08
    El período de la ciudad,
    00:08:09
    Así que sí, aquí,
    00:08:09
    No es especialmente un problema.
    00:08:11
    La palabra habitual al principio,
    00:08:13
    Vemos que hay pequeños
    00:08:14
    preocupaciones sobre el formato escolar,
    00:08:14
    Estábamos mezclados con números y meses,
    00:08:18
    pero la información es relevante,
    00:08:19
    Así que veremos cómo el
    00:08:21
    Manipular el sitio web ¿por qué no?
    00:08:23
    Podremos explotarlo.
    00:08:25
    El número de identificación,
    00:08:27
    Así que eso es bastante importante,
    00:08:28
    Nosotros también lo mantendremos.
    00:08:30
    ¿El municipio principal?
    00:08:32
    Otra comuna allí,
    00:08:33
    Este es el primer caso en el que vamos a
    00:08:35
    tiene un poco más de problemas
    00:08:37
    para explotar porque ya lo hará
    00:08:39
    ser bastante complicado de decir
    00:08:40
    que en un festival nos ocuparemos
    00:08:42
    Varios municipios, por ejemplo,
    00:08:43
    para mostrar en un mapa,
    00:08:45
    Será mucho más sencillo
    00:08:46
    tener un solo punto y
    00:08:48
    Además de eso en el paso elevado en nuestro nuestro.
    00:08:51
    Lea nuestra columna,
    00:08:53
    Vemos que está vacío en el 90% de los casos,
    00:08:56
    Así que aquí estamos típicamente en un caso en el que
    00:08:59
    no es relevante mantener la columna,
    00:09:02
    Así que tendremos varios métodos,
    00:09:04
    eh para eliminar una columna,
    00:09:05
    el primero te muestro aquí,
    00:09:06
    es simplemente seleccionarlo,
    00:09:09
    para hacer un clic derecho que se abrirá
    00:09:11
    Todo un panel de control
    00:09:12
    que corresponde muy ampliamente
    00:09:13
    lo que encontrarás,
    00:09:15
    especialmente en la pestaña de
    00:09:17
    transformación directamente en en
    00:09:19
    el en el poder yo y aquí vamos
    00:09:22
    Simplemente haga clic en eliminar.
    00:09:25
    Vemos que se acaba de añadir un paso,
    00:09:27
    eh, aquí.
    00:09:30
    Y así vamos a continuar aquí
    00:09:34
    nuestra exploración,
    00:09:35
    así que la fecha de inicio,
    00:09:37
    Así que vemos que le falta mucho,
    00:09:39
    pero todavía está bien
    00:09:40
    ser útil para más adelante,
    00:09:41
    Porque en particular para hacer
    00:09:43
    representaciones en el tiempo de,
    00:09:44
    del volumen del festival así que lo mantendremos.
    00:09:47
    La fecha de finalización, la fecha de creación,
    00:09:49
    el código postal muy bien,
    00:09:50
    Código postal y código INSEE.
    00:09:52
    Así que aquí en nuestro caso,
    00:09:55
    Yo te digo,
    00:09:55
    Principalmente vamos a trabajar desde
    00:09:58
    del código postal es decir, el código INSEE
    00:10:00
    Es algo muy diferente.
    00:10:03
    Así que es un,
    00:10:03
    Esta es otra forma de
    00:10:05
    designar un municipio y que
    00:10:07
    no me interesará demasiado.
    00:10:09
    Así que aquí tendré más bien a
    00:10:12
    Para que se elimine esta columna
    00:10:15
    Así que hay del código del código que es.
    00:10:18
    Porque cabe para más o
    00:10:20
    menos para mí a un duplicado del código postal.
    00:10:23
    Es solo un formato un poco más complicado.
    00:10:27
    Entonces, otro método
    00:10:28
    para eliminar una columna,
    00:10:30
    Así que aquí lo seleccionaremos.
    00:10:32
    Vamos a ir a la recepción
    00:10:33
    Y vemos aquí que tenemos un artículo.
    00:10:35
    Gestiona las columnas y allí lo hará
    00:10:37
    Ofrécenos 2 cosas así que 2
    00:10:39
    elegir abolir la escuela,
    00:10:41
    Así que elimine las columnas.
    00:10:41
    Bah es bastante simple eh,
    00:10:42
    No eliminó el
    00:10:44
    columnas que selecciono y
    00:10:46
    para su información, puedo hacer todo
    00:10:48
    hecho por tenencia de capital o
    00:10:50
    Control sobre mi reseña en mi teclado
    00:10:53
    para poder seleccionar 2 columnas,
    00:10:55
    Vuelve aquí y haz clic.
    00:10:58
    ¿Eliminar columnas?
    00:10:59
    Entonces, ¿qué pasa si hago esto aquí?
    00:11:01
    Así que, obviamente, puede volver.
    00:11:02
    Esta será una oportunidad para mostrarte.
    00:11:05
    Vemos que, Bueno,
    00:11:06
    Eliminó el LES,
    00:11:09
    las 2 columnas a la vez.
    00:11:10
    Así que vamos a volver.
    00:11:13
    Volveremos a nuestro código insee.
    00:11:17
    Y vamos a volver aquí.
    00:11:20
    El campo que quiero mostrar,
    00:11:22
    así que administre las columnas eliminadas y
    00:11:23
    Ahora tengo otra opción que
    00:11:25
    es eliminar las otras columnas,
    00:11:27
    Así que ahí tendrá el efecto
    00:11:28
    exactamente invertido que va a ser
    00:11:30
    eliminar todas las columnas excepto
    00:11:31
    los que seleccioné.
    00:11:32
    Así que lo mismo aplicaremos pero no
    00:11:34
    Pánico podemos volver.
    00:11:36
    Así que ves aquí,
    00:11:38
    Solo guardaba mis columnas.
    00:11:42
    Así que volvemos otra vez.
    00:11:45
    Y para mostrarle lo último
    00:11:47
    funcionalidad en torno a eso
    00:11:49
    volverá a nuestro código en C
    00:11:51
    y vamos a tener el revés,
    00:11:53
    es decir, elegir las columnas,
    00:11:54
    elige las columnas,
    00:11:55
    Va a ser sólo para decir,
    00:11:57
    Bueno, yo elijo.
    00:11:59
    La columna que me interesa aquí,
    00:12:01
    Voy a tener un campo que se abrirá,
    00:12:02
    Así que allí, aquí,
    00:12:03
    Solo tengo que desentrañar los potenciales,
    00:12:07
    las columnas potenciales que
    00:12:08
    No me interesa.
    00:12:10
    Y así él sólo irá a mí.
    00:12:11
    mantener el que seleccioné
    00:12:13
    y de la misma manera.
    00:12:17
    Si estoy buscando una columna
    00:12:18
    Especialmente porque no lo hago
    00:12:20
    no lo encuentra en la lista,
    00:12:21
    Podré aquí, por ejemplo,
    00:12:22
    Clic. A mi famoso código insee.
    00:12:30
    Así que mi código pin está aquí
    00:12:32
    el código se deja aquí,
    00:12:33
    Yo selecciono y por lo tanto quién
    00:12:35
    Llévame directamente a la columna
    00:12:37
    para después potencialmente el
    00:12:39
    eliminar así que aquí lo haré
    00:12:41
    Volver a mi menú hop lo haré
    00:12:44
    Haga que se eliminen las columnas.
    00:12:47
    O no, elige las columnas
    00:12:48
    Elija las columnas.
    00:12:52
    Y ahí lo vemos.
    00:12:55
    Los otros municipios porque
    00:12:56
    que eliminé el paso,
    00:12:58
    está presente de nuevo,
    00:13:00
    Así que aquí haré clic en
    00:13:03
    Lo haré
    00:13:05
    También desactive el código INSEE.
    00:13:07
    Hago clic en Aceptar.
    00:13:09
    Y ahí vemos que tengo un nuevo artículo
    00:13:12
    que acaba de ser eliminado.
    00:13:16
    Y así podremos
    00:13:17
    continuar nuestro trabajo,
    00:13:18
    Así que aquí tenemos la redacción de la comuna
    00:13:21
    Así que esa es la redacción de la comuna.
    00:13:23
    Para más información,
    00:13:24
    Ya lo teníamos aquí, así que es
    00:13:26
    como principal así que no muy
    00:13:29
    relevante para mantener esta columna
    00:13:30
    Así que aquí lo vamos a hacer desde
    00:13:32
    Forma clásica eliminando.
    00:13:36
    ¿Qué sigue? Continuaremos
    00:13:41
    así que verifique el departamento de SK,
    00:13:43
    Es información
    00:13:45
    que teníamos en otros lugares.
    00:13:47
    Un poco más lejos.
    00:13:51
    Este es el departamento que está aquí
    00:13:53
    Así que no hay necesidad de mantener.
    00:13:56
    ¿Esa columna?
    00:13:58
    Ves uno en otro lugar que aquí
    00:14:01
    Las columnas eliminadas no son
    00:14:03
    que un solo paso y lo vemos en
    00:14:06
    Esta hoja aquí me la dirá
    00:14:08
    así que esa es la M, así que es la
    00:14:11
    mashup es básicamente el código que
    00:14:12
    se genera en cada uno de mis pasos
    00:14:14
    así que no encajo en absoluto
    00:14:15
    El detalle por ahora sobre esto
    00:14:16
    Tendremos tiempo para hablar de ello de nuevo
    00:14:18
    pero en cualquier caso te permite,
    00:14:19
    Si llegas al at,
    00:14:21
    Léelo para saber un poco
    00:14:23
    lo que está sucediendo en el estado.
    00:14:25
    Así que aquí,
    00:14:26
    He eliminado el departamento y K y
    00:14:30
    Luego tenemos nuestro volumen de participantes.
    00:14:33
    2018 2017 así que ahí estamos bastante bien,
    00:14:34
    Vamos a hacer otro pase.
    00:14:35
    El nombre del evento
    00:14:36
    no tiene ningún problema,
    00:14:37
    la región el dominio completamente,
    00:14:38
    periodicidad del departamento de dominio,
    00:14:40
    mes de inicio, el sitio web,
    00:14:43
    el número de identificación,
    00:14:44
    el municipio, el número de la edición,
    00:14:46
    la fecha de inicio de la fecha de finalización,
    00:14:48
    la fecha de creación,
    00:14:49
    el código postal, el código INSEE,
    00:14:51
    el nombre del departamento y el 2
    00:14:54
    Volúmenes de participantes para 2018.
    00:14:56
    En 2017, por lo tanto,
    00:14:57
    a partir de ahí,
    00:14:58
    Podemos considerar que hemos eliminado
    00:15:00
    Todas las columnas que no estaban
    00:15:01
    No es necesario para nuestro proyecto.

    Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
    Effectuez une autre recherche ou retournez au contenu !

     

    00:00:02
    Dus nu we
    00:00:03
    slaat ons bestand op,
    00:00:04
    We zullen in staat zijn om te beginnen met het realiseren van
    00:00:06
    onze eerste opwerking,
    00:00:07
    Dus daarvoor, als we hier eenmaal zijn,
    00:00:08
    We gaan aan de slag met het transformeren van de data.
    00:00:11
    Transformeer de gegevens die worden verzonden
    00:00:13
    laat ons Power Quéry weergeven
    00:00:15
    en het eerste interessante element,
    00:00:17
    We zien dat er al stappen zijn gezet.
    00:00:18
    van opwerking terwijl we
    00:00:20
    niets vroeg een herinnering,
    00:00:21
    We hebben net een lading van
    00:00:23
    data en daarom hebben we het gedaan.
    00:00:24
    Het was om je precies te laten zien
    00:00:26
    Het soort intelligentie dat
    00:00:28
    kan in spreekwoordelijk zijn,
    00:00:29
    Dus we eigenlijk wat we vroegen,
    00:00:31
    Het is deze eerste stap die hier is,
    00:00:32
    dat is de gegevensbron hè.
    00:00:34
    Dus ter herinnering,
    00:00:35
    als ik hier klik op de tandeloze Pedro,
    00:00:38
    We gaan het pad hebben
    00:00:39
    naar het bestand als u wordt misleid,
    00:00:41
    Nou, je kunt hier klikken
    00:00:42
    op bladeren. Om het nog een keer te doen?
    00:00:46
    En dan gaan we naar navigatie,
    00:00:48
    Dus dat is normaal, hè,
    00:00:49
    Dit is wanneer we de
    00:00:51
    eentje om te kunnen werken en door
    00:00:53
    Tegenover wat interessant is, is
    00:00:54
    dat het automatisch de
    00:00:56
    het feit dat de tabel
    00:00:58
    Dus dat is best goed.
    00:01:00
    Dit houdt verband met het feit dat de
    00:01:02
    in Excel was zeer goed voorbereid
    00:01:04
    in de zin dat het werd verklaard in
    00:01:07
    als tabel in Excel dus dit
    00:01:10
    wat verklaart hierna zeker
    00:01:12
    intelligentie eh sinds Excel
    00:01:13
    het is ook Microsoft en we zien
    00:01:15
    Een ander element is dat.
    00:01:17
    Hij veranderde.
    00:01:18
    En de soorten van sommige,
    00:01:21
    bepaalde kolommen,
    00:01:21
    Dus daar aan de andere kant,
    00:01:23
    Het zal ook een beetje duren
    00:01:24
    wees er een beetje huiverig voor,
    00:01:25
    wat hij uit bepaalde dingen kan afleiden
    00:01:26
    die er voor een keer niet zijn
    00:01:29
    noodzakelijkerwijs waar, dus het zal gaan om
    00:01:30
    Anyways om het type te controleren huh.
    00:01:32
    Ter herinnering,
    00:01:33
    Het type staat hier op elke kolom
    00:01:36
    om het type van de,
    00:01:38
    van de column en dat is interessant
    00:01:40
    juist om te kunnen maken
    00:01:42
    sommen op bijvoorbeeld getallen,
    00:01:44
    machtsgetallen,
    00:01:46
    bereken de duur tussen 2 datums.
    00:01:48
    Dus hier zullen we data nodig hebben.
    00:01:50
    Om aaneenschakelingen te kunnen maken van
    00:01:52
    extracties via een tekstkolom,
    00:01:54
    et cetera, et cetera.
    00:01:56
    Het is dus een vrij belangrijke stap.
    00:01:58
    dus hier zullen we zeggen dat Macht
    00:02:01
    mail heeft zijn werk vrij goed gedaan
    00:02:03
    en we zullen een beetje kunnen beginnen
    00:02:06
    Weinig om de aanpassingen voort te zetten.
    00:02:08
    Dus de eerste stap dat ik
    00:02:10
    adviseert u daar op het moment dat u
    00:02:12
    bracht uw eerste dataset,
    00:02:14
    is om door de kolommen te sorteren
    00:02:16
    dat u herstelde toen wij
    00:02:19
    heeft het bestand in Excel gecrawld,
    00:02:20
    We zagen dat we potentieel
    00:02:22
    Duplicaten.
    00:02:22
    Dingen die niet per se waren
    00:02:24
    interessant van van om binnen te houden
    00:02:26
    de in het dossier en dus zullen we
    00:02:28
    probeer een beetje te begrijpen waarin
    00:02:30
    In het geval dat kolommen moeten worden verwijderd.
    00:02:34
    Dan
    00:02:35
    Stel je voor dat we bezig zijn met
    00:02:37
    van de uitgevoerde verkoopgegevens
    00:02:39
    door één, door een bedrijf.
    00:02:41
    Dus wat zijn de grote stappen van figuur
    00:02:43
    waarin we kunnen zeggen dat we
    00:02:44
    het recht om het recht definitief af te schaffen,
    00:02:46
    De mogelijkheid om een kolom te verwijderen?
    00:02:48
    De eerste is dat de gegevens
    00:02:51
    zijn niet nodig voor het project.
    00:02:53
    Hier zijn we één op één,
    00:02:57
    op een verkoopoverzicht dat
    00:02:59
    werden uitgevoerd door een bedrijf,
    00:03:01
    om bijvoorbeeld het nummer te hebben
    00:03:03
    van de telefoons van klanten.
    00:03:04
    In een visualisatietool,
    00:03:06
    Het gaat me niet veel goeds doen.
    00:03:09
    Dus waarom deze column houden
    00:03:11
    daar die mijn schilderij zal vervuilen,
    00:03:13
    die mogelijk zal toenemen
    00:03:15
    ook mijn dossier,
    00:03:17
    dus er potentieel als het is
    00:03:18
    nutteloos voor wat ik probeer te doen,
    00:03:21
    Nou, ik kan de kolom verwijderen.
    00:03:24
    Merk op dat als u nog niet
    00:03:26
    zeker dat de kolom nuttig voor u is,
    00:03:29
    je kunt het laten staan en
    00:03:31
    later verwijderen, hè,
    00:03:32
    Het is heel goed mogelijk om
    00:03:34
    licht incrementele deleties,
    00:03:36
    iets later in de opwerking.
    00:03:39
    Een ander element,
    00:03:40
    het zijn duplicaten,
    00:03:41
    Het gebeurt dus heel vaak om
    00:03:43
    Waar we ons vaak mee verbinden
    00:03:44
    technische bronnen,
    00:03:46
    Het is dus het feit dat 2
    00:03:49
    kolommen gaan merkbaar omhoog,
    00:03:50
    hetzij precies dezelfde informatie,
    00:03:52
    of bijna.
    00:03:53
    Dus na vraag van formaat de
    00:03:55
    dezelfde informatie dus bijvoorbeeld
    00:03:56
    hier in het geval geef ik deze 2
    00:03:59
    kolommen met de maand van de verkoop,
    00:04:00
    er is er een die in geschreven vorm is,
    00:04:02
    Dus het zou worden geschreven bijgevoegd en het andere formaat.
    00:04:04
    Nee, het zal 6 worden geschreven, dus er is meestal
    00:04:06
    Het is niet handig om de 2 te houden
    00:04:08
    huh het is dezelfde informatie.
    00:04:10
    Dus hier de meest logische,
    00:04:11
    het is gewoon om de
    00:04:13
    formaat dat het beste bij ons past,
    00:04:14
    dus potentieel het cijfer,
    00:04:16
    omdat ik de neiging zou hebben om
    00:04:20
    doen voor en dan verwijderen
    00:04:22
    De teksttestkolom.
    00:04:24
    Geef een consistente,
    00:04:26
    Dus hier bevinden we ons in een
    00:04:29
    kolom of in 95% van de gevallen,
    00:04:31
    De gegevens zijn niet beschikbaar, dus
    00:04:33
    Is het echt relevant
    00:04:35
    om een kolom te behouden waar er ook
    00:04:38
    Meer van zo weinig gegevens aanwezig
    00:04:40
    en dus daar in de zaak die ik geef
    00:04:43
    code de code laten we ons een barcode voorstellen?
    00:04:45
    De id wordt zeer zelden ingevuld
    00:04:49
    Dus en wat ik echt ga kunnen
    00:04:52
    gegevens op 5% van de lijnen exploiteren.
    00:04:54
    Misschien niet
    00:04:55
    en dus in dat geval is het meer
    00:04:57
    Verstandig om de kolom te verwijderen.
    00:04:59
    En het laatste element,
    00:05:01
    het zijn gegevens van slechte kwaliteit,
    00:05:03
    Dus laten we zeggen dat je een
    00:05:05
    kolom met het label Code
    00:05:06
    post en dat van tijd tot tijd,
    00:05:07
    U zult eerder vinden
    00:05:09
    de naam van de winkel,
    00:05:11
    Dus van tijd tot tijd,
    00:05:12
    Laten we ons zelfs voorstellen dat in de helft van de gevallen,
    00:05:14
    of zelfs te veel,
    00:05:14
    de naam van de winkel zo blijkt
    00:05:16
    een beetje probleem dat
    00:05:18
    kan rond deze column hebben gehad
    00:05:20
    daar en dus mogelijk zelfs de
    00:05:22
    aanwezige postcodes,
    00:05:23
    wat normaal gesproken het juiste formaat zou zijn,
    00:05:25
    zijn mogelijk onwaar en daarom
    00:05:27
    Wees voorzichtig dat het gevaarlijk kan zijn.
    00:05:29
    Nog een keer
    00:05:31
    U hoeft de
    00:05:33
    de kolommen als je twijfelt,
    00:05:36
    Dat kun je even later doen.
    00:05:37
    Maar over het algemeen, wanneer je een
    00:05:39
    beetje het antwoord in gedachten,
    00:05:41
    Nou, dat kan direct
    00:05:43
    Verwijder de kolom.
    00:05:45
    Dus daarvoor gaan we ons omdraaien,
    00:05:47
    we gaan naar Power Quéry.
    00:05:53
    Hier, dat is het, we zullen er elders van genieten
    00:05:56
    om onze dataset te hernoemen
    00:05:58
    die we hier festival zullen noemen. Daar ga je.
    00:06:05
    En we gaan een beetje kunnen doen
    00:06:07
    bekijk onze dataset,
    00:06:09
    dus de naam van het evenement
    00:06:12
    Daar heb ik geen probleem mee.
    00:06:14
    De regio ook niet,
    00:06:16
    Het domeininvoegtoepassingsdomein.
    00:06:19
    Het ziet er niet erg vol uit dus
    00:06:21
    Hoe ik weet wat veel is
    00:06:23
    gevuld of niet veel gevuld,
    00:06:25
    Dus je hebt deze sub-bar hier
    00:06:26
    die u een bepaald nummer geeft
    00:06:29
    zeer interessante informatie.
    00:06:30
    Dus het feit dat we door
    00:06:34
    voorbeeld hier 67% van voltooiing van de
    00:06:37
    van de kolom dus in 67% van de gevallen,
    00:06:40
    De rij heeft een waarde.
    00:06:42
    Hij zal ons ook
    00:06:44
    een foutindicator,
    00:06:46
    dus potentieel lijnen
    00:06:47
    die fouten bevatten.
    00:06:48
    We zullen de soorten fouten zien
    00:06:50
    dat kan.
    00:06:51
    En dan het aantal lege kolommen.
    00:06:54
    En dat, plotseling, Zie je hier dan,
    00:06:55
    als het groen is,
    00:06:56
    Nou dat is de,
    00:06:58
    de wholesale voltooiingsmeter van
    00:07:00
    de van de kolom en het geeft niet
    00:07:03
    Al hier opties om te verwijderen
    00:07:04
    bijvoorbeeld lege elementen,
    00:07:06
    dus namelijk de lijnen die zijn,
    00:07:08
    die er dus duidelijk zijn,
    00:07:09
    daar gaan we,
    00:07:10
    We gaan het niet doen omdat we
    00:07:12
    2/3 van de kolommen gevuld zodat
    00:07:14
    kan heel relevant zijn in
    00:07:15
    termen van in termen van exploitatie.
    00:07:17
    Een ander punt is belangrijk,
    00:07:19
    We zien dat de kolommen die
    00:07:21
    zijn in eerste instantie leeg in de.
    00:07:23
    In het dossier zijn hier
    00:07:25
    aangevuld met de waarde nul,
    00:07:27
    Dus dat is heel belangrijk en dat doe je niet.
    00:07:30
    Vind nooit een echt lege waarde.
    00:07:32
    Feitelijk
    00:07:33
    Sinds query power
    00:07:34
    automatisch en goed kunnen doen,
    00:07:35
    Hij gaat dat vervangen door nul.
    00:07:37
    Het moet niet worden begrepen door een echte tekst,
    00:07:40
    een echte formulering,
    00:07:41
    het is maar een visie,
    00:07:44
    een manier om de waarde te visualiseren,
    00:07:46
    Het feit dat de waarde leeg is.
    00:07:48
    Maar zoals je ziet,
    00:07:49
    het staat cursief en daarom is het
    00:07:50
    heeft geen echte waarde.
    00:07:52
    Aan de andere kant kunnen we er alles aan doen om
    00:07:53
    zegt bijvoorbeeld.
    00:07:54
    Ik verwijder alle null-waarden
    00:07:56
    van een zuil en daar ineens geeft het ons
    00:07:59
    helpt veel om een appellation te hebben
    00:08:00
    hiervoor voor de afwezigheid van waarde.
    00:08:04
    Dan hebben we de afdeling.
    00:08:08
    De stadsperiode,
    00:08:09
    Dus ja, hier,
    00:08:09
    Niet bepaald een probleem.
    00:08:11
    Het gebruikelijke woord aan het begin,
    00:08:13
    We zien dat er kleine
    00:08:14
    betreft de schoolindeling,
    00:08:14
    we waren gemengd met cijfers en maanden,
    00:08:18
    maar de informatie is relevant,
    00:08:19
    Dus we zullen zien hoe de
    00:08:21
    De website manipuleren waarom niet?
    00:08:23
    We zullen het kunnen exploiteren.
    00:08:25
    Het identificatienummer,
    00:08:27
    Dus dat is best belangrijk,
    00:08:28
    We houden het ook.
    00:08:30
    De belangrijkste gemeente?
    00:08:32
    Een andere gemeente daar,
    00:08:33
    Dit is het eerste geval waarin we
    00:08:35
    heb iets meer moeite
    00:08:37
    om te exploiteren omdat het al zal
    00:08:39
    zijn vrij ingewikkeld om te zeggen
    00:08:40
    dat we ons op een festival zorgen zullen maken
    00:08:42
    Verschillende gemeenten bijvoorbeeld
    00:08:43
    om weer te geven op een kaart,
    00:08:45
    het zal veel eenvoudiger zijn
    00:08:46
    om slechts één punt te hebben en
    00:08:48
    Daarnaast bij het viaduct op de onze.
    00:08:51
    Lees onze column,
    00:08:53
    We zien dat het in 90% van de gevallen leeg is,
    00:08:56
    Dus hier zijn we meestal op een geval waar het
    00:08:59
    niet relevant is om de kolom te behouden,
    00:09:02
    Dus we zullen verschillende methoden hebben,
    00:09:04
    eh om een kolom te verwijderen,
    00:09:05
    de eerste die ik je hier laat zien,
    00:09:06
    het is gewoon om het te selecteren,
    00:09:09
    om een rechterklik te maken die wordt geopend
    00:09:11
    Een heel bedieningspaneel
    00:09:12
    wat heel breed overeenkomt
    00:09:13
    wat u zult vinden,
    00:09:15
    vooral in het tabblad van
    00:09:17
    transformatie direct in in
    00:09:19
    de in macht ik en daar gaan we
    00:09:22
    Klik gewoon op verwijderen.
    00:09:25
    We zien dat er net een stap is toegevoegd,
    00:09:27
    huh, hier.
    00:09:30
    En dus gaan we hier verder.
    00:09:34
    onze verkenning,
    00:09:35
    dus de startdatum,
    00:09:37
    We zien dus dat er veel ontbreekt,
    00:09:39
    maar het is nog steeds oké
    00:09:40
    nuttig zijn voor later,
    00:09:41
    Want vooral om
    00:09:43
    representaties in de tijd van,
    00:09:44
    van het festivalvolume dus we houden het.
    00:09:47
    De einddatum, de aanmaakdatum,
    00:09:49
    de postcode zeer goed,
    00:09:50
    Postcode en INSEE-code.
    00:09:52
    Dus hier wij in ons geval,
    00:09:55
    Ik zeg u,
    00:09:55
    We gaan vooral werk doen vanuit
    00:09:58
    van de postcode dus de INSEE-code
    00:10:00
    Het is iets heel anders.
    00:10:03
    Dus het is een,
    00:10:03
    Dit is een andere manier van
    00:10:05
    een gemeente aanwijzen en dat
    00:10:07
    zal me niet te veel interesseren.
    00:10:09
    Dus hier zal ik eerder de neiging hebben om
    00:10:12
    te verwijderen uit deze kolom
    00:10:15
    Dus daar van de code van de code is het.
    00:10:18
    Omdat het geschikt is voor meer of
    00:10:20
    minder voor mij tot een duplicaat van de postcode.
    00:10:23
    Het is gewoon een iets ingewikkelder formaat.
    00:10:27
    Dus, een andere methode
    00:10:28
    om een kolom te verwijderen,
    00:10:30
    Dus hier zullen we het selecteren.
    00:10:32
    We gaan naar de receptie
    00:10:33
    En we zien hier dat we een item hebben.
    00:10:35
    Beheer de kolommen en daar zal het
    00:10:37
    bied ons 2 dingen dus 2
    00:10:39
    ervoor kiezen om de school af te schaffen,
    00:10:41
    dus verwijder de kolommen.
    00:10:41
    Bah het is vrij simpel hè,
    00:10:42
    Het heeft de
    00:10:44
    kolommen die ik selecteer en
    00:10:46
    dus FYI ik kan alles doen
    00:10:48
    gedaan door het aanhouden van kapitaal of
    00:10:50
    Controle over mijn review op mijn toetsenbord
    00:10:53
    om 2 kolommen te kunnen selecteren,
    00:10:55
    ga hier terug en klik.
    00:10:58
    Kolommen verwijderen?
    00:10:59
    Dus wat als ik dit hier doe?
    00:11:01
    Dus natuurlijk, kan teruggaan.
    00:11:02
    Dit zal een gelegenheid zijn om het je te laten zien.
    00:11:05
    We zien dat, Nou,
    00:11:06
    hij schrapte de les,
    00:11:09
    de 2 kolommen tegelijk.
    00:11:10
    Dus we gaan terug.
    00:11:13
    We gaan terug naar onze inseecode.
    00:11:17
    We gaan hier nog eens op terug.
    00:11:20
    Het veld dat ik wil laten zien,
    00:11:22
    dus beheer de verwijderde kolommen en
    00:11:23
    Nu heb ik een andere optie die
    00:11:25
    is de andere kolommen verwijderen,
    00:11:27
    Dus daar zal het effect hebben
    00:11:28
    precies omgekeerd wat gaat worden
    00:11:30
    alle kolommen verwijderen, behalve
    00:11:31
    degene die ik heb geselecteerd.
    00:11:32
    Dus hetzelfde zullen we toepassen, maar nee
    00:11:34
    Paniek kunnen we terug.
    00:11:36
    Zo zie je hier,
    00:11:38
    Hij bewaarde alleen mijn columns.
    00:11:42
    Dus gaan we weer terug.
    00:11:45
    En om u het laatste nieuws te laten zien
    00:11:47
    functionaliteit daaromheen dat we
    00:11:49
    gaat terug naar onze code in C
    00:11:51
    en we gaan het kale omgekeerde hebben,
    00:11:53
    d.w.z. kies de kolommen,
    00:11:54
    kies de kolommen,
    00:11:55
    Het zal alleen maar zijn om te zeggen:
    00:11:57
    Nou, ik kies.
    00:11:59
    De column die mij hier interesseert,
    00:12:01
    Ik ga een veld hebben dat opengaat,
    00:12:02
    Dus daar, hier,
    00:12:03
    Ik hoef alleen maar de mogelijkheden te ontpinnen,
    00:12:07
    de potentiële kolommen die
    00:12:08
    Het interesseert me niet.
    00:12:10
    En dus gaat hij alleen naar mij toe.
    00:12:11
    bewaar degene die ik heb geselecteerd
    00:12:13
    en op dezelfde manier.
    00:12:17
    Als ik op zoek ben naar een column
    00:12:18
    Vooral omdat ik dat niet doe.
    00:12:20
    vindt het niet in de lijst,
    00:12:21
    Ik zal hier bijvoorbeeld kunnen,
    00:12:22
    Klikken. Naar mijn beroemde insee code.
    00:12:30
    Dus mijn pincode is hier het
    00:12:32
    de code is hier achtergelaten,
    00:12:33
    Ik selecteer en dus wie zal
    00:12:35
    Breng me direct naar de kolom
    00:12:37
    voor na eventueel de
    00:12:39
    verwijderen dus hier zal ik
    00:12:41
    Ga terug naar mijn menu hop ik zal
    00:12:44
    Laat de kolommen verwijderen.
    00:12:47
    Of niet, kies de kolommen
    00:12:48
    Kies de kolommen.
    00:12:52
    En daar zien we dat.
    00:12:55
    De andere gemeenten omdat
    00:12:56
    dat ik de stap heb verwijderd,
    00:12:58
    is weer aanwezig,
    00:13:00
    Dus hier zal ik klikken op
    00:13:03
    Doe ik
    00:13:05
    Maak ook de INSEE-code los.
    00:13:07
    Ik klik op OK.
    00:13:09
    En daar zien we dus dat ik een nieuw item heb.
    00:13:12
    die zojuist is verwijderd.
    00:13:16
    En zo zullen we in staat zijn om
    00:13:17
    ons werk voort te zetten,
    00:13:18
    Dus hier hebben we de formulering van de gemeente
    00:13:21
    Dat is dus de formulering van de gemeente.
    00:13:23
    Voor informatie,
    00:13:24
    We hadden het hier al, dus het is
    00:13:26
    als een belangrijkste dus niet erg
    00:13:29
    relevant om deze column te behouden
    00:13:30
    Dus hier gaan we het doen vanaf
    00:13:32
    klassieke manier door te verwijderen.
    00:13:36
    Wat is de volgende stap? We zullen doorgaan met
    00:13:41
    dus check de SK afdeling,
    00:13:43
    het is informatie
    00:13:45
    die we elders hadden.
    00:13:47
    Iets verderop.
    00:13:51
    Dit is de afdeling die hier is
    00:13:53
    dus niet nodig om te houden.
    00:13:56
    Die column?
    00:13:58
    Je ziet er eentje elders die hier
    00:14:01
    Verwijderde kolommen zijn niet
    00:14:03
    dat een enkele stap en dat zien we in
    00:14:06
    Dit blad hier zal hij me vertellen
    00:14:08
    dus dat is de M dus het is de
    00:14:11
    mashup is in feite de code die
    00:14:12
    wordt gegenereerd bij elk van mijn stappen
    00:14:14
    dus ik pas er helemaal niet in
    00:14:15
    Het detail voor nu hierover
    00:14:16
    We hebben tijd om er nog eens over te praten
    00:14:18
    maar in ieder geval kunt u,
    00:14:19
    Als u aankomt bij de at,
    00:14:21
    Lees het om een beetje te weten
    00:14:23
    wat er in de staat gebeurt.
    00:14:25
    Dus hier,
    00:14:26
    Ik heb de afdeling en K en
    00:14:30
    Dan hebben we ons deelnemersvolume.
    00:14:33
    2018 2017 dus daar zijn we redelijk goed,
    00:14:34
    We gaan nog een pas maken.
    00:14:35
    De naam van het evenement
    00:14:36
    heeft geen probleem,
    00:14:37
    de regio het domein volledig,
    00:14:38
    periodiciteit van de domeinafdeling,
    00:14:40
    startmaand, de website,
    00:14:43
    het identificatienummer,
    00:14:44
    de gemeente, het nummer van de uitgave,
    00:14:46
    de begindatum van de einddatum,
    00:14:48
    de datum van creatie,
    00:14:49
    de postcode, de INSEE-code,
    00:14:51
    de naam van de afdeling en de 2
    00:14:54
    Deelnemersvolumes voor 2018.
    00:14:56
    In 2017 is daarom
    00:14:57
    daarvandaan
    00:14:58
    We kunnen ervan uitgaan dat we hebben verwijderd
    00:15:00
    alle kolommen die niet
    00:15:01
    niet nodig voor ons project.

    Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
    Effectuez une autre recherche ou retournez au contenu !

     

    00:00:02
    Então, agora que nós
    00:00:03
    salva nosso arquivo,
    00:00:04
    Seremos capazes de começar a perceber
    00:00:06
    nosso primeiro reprocessamento,
    00:00:07
    Então, para isso, uma vez que estamos aqui,
    00:00:08
    Vamos transformar os dados.
    00:00:11
    Transforme os dados que vão
    00:00:13
    permitem-nos exibir Power Quéry
    00:00:15
    e o primeiro elemento interessante,
    00:00:17
    Vemos que já houve passos
    00:00:18
    de reprocessamento enquanto temos
    00:00:20
    nada pediu uma lembrança,
    00:00:21
    Acabamos de fazer um monte de
    00:00:23
    dados e é por isso que o fizemos.
    00:00:24
    Foi para mostrar precisamente a você
    00:00:26
    O tipo de inteligência que
    00:00:28
    pode ser em proverbial,
    00:00:29
    Então, nós basicamente o que pedimos,
    00:00:31
    É este primeiro passo que está aqui,
    00:00:32
    que é a fonte de dados hein.
    00:00:34
    Então, como um lembrete,
    00:00:35
    se eu clicar aqui no Pedro desdentado,
    00:00:38
    Nós vamos ter o caminho
    00:00:39
    para o arquivo, se você for enganado,
    00:00:41
    Bem, você pode clicar aqui
    00:00:42
    na navegação. Para fazer isso de novo?
    00:00:46
    E então vamos para a navegação,
    00:00:48
    Então isso é normal, hein,
    00:00:49
    Foi quando selecionamos o
    00:00:51
    um para ser capaz de trabalhar e por
    00:00:53
    Contra o que é interessante é
    00:00:54
    que detectou automaticamente o
    00:00:56
    o facto de o quadro incluir
    00:00:58
    Então isso é muito bom.
    00:01:00
    Isso está relacionado ao fato de que o
    00:01:02
    no Excel foi muito bem preparado
    00:01:04
    no sentido em que foi declarado em
    00:01:07
    como uma tabela no Excel para que este
    00:01:10
    que explica depois disso certo
    00:01:12
    inteligência eh desde Excel
    00:01:13
    também é a Microsoft e vemos
    00:01:15
    Outro elemento é esse.
    00:01:17
    Ele mudou.
    00:01:18
    E os tipos de alguns,
    00:01:21
    determinadas colunas,
    00:01:21
    Então, por outro lado,
    00:01:23
    Também vai demorar um pouco
    00:01:24
    seja um pouco cauteloso com isso,
    00:01:25
    o que ele pode deduzir de certas coisas
    00:01:26
    que lá por uma vez não são
    00:01:29
    necessariamente verdadeiro para que envolva
    00:01:30
    enfim para verificar o tipo hein.
    00:01:32
    Como lembrete,
    00:01:33
    O tipo está aqui em cada coluna
    00:01:36
    para poder alterar o tipo do do
    00:01:38
    da coluna e isso é interessante
    00:01:40
    precisamente para ser capaz de fazer
    00:01:42
    somas relativas, por exemplo, a números,
    00:01:44
    números de potência,
    00:01:46
    calcular durações entre 2 datas.
    00:01:48
    Então, aqui vamos precisar de datas.
    00:01:50
    Ser capaz de fazer concatenações de
    00:01:52
    extrações através de uma coluna de texto,
    00:01:54
    et cetera, et cetera.
    00:01:56
    Então é um passo muito importante.
    00:01:58
    então aqui vamos dizer que o Poder
    00:02:01
    correio tem feito o seu trabalho muito bem
    00:02:03
    e poderemos começar um pouco
    00:02:06
    Pouco para continuar as modificações.
    00:02:08
    Então, o primeiro passo que eu
    00:02:10
    aconselha-o lá no momento que você tem
    00:02:12
    trouxe seu primeiro conjunto de dados,
    00:02:14
    é classificar através das colunas
    00:02:16
    que você recuperou quando nós
    00:02:19
    rastreou o arquivo no Excel,
    00:02:20
    Vimos que potencialmente tínhamos
    00:02:22
    Duplicatas.
    00:02:22
    Coisas que não eram necessariamente
    00:02:24
    interessante de de manter em
    00:02:26
    o no arquivo e assim vamos
    00:02:28
    tente entender um pouco em que
    00:02:30
    Caso as colunas devam ser suprimidas.
    00:02:34
    Então
    00:02:35
    Vamos imaginar que estamos trabalhando em
    00:02:37
    dos dados de vendas realizados
    00:02:39
    por um, por uma empresa.
    00:02:41
    Então, quais são os grandes passos da figura
    00:02:43
    em que podemos dizer que temos
    00:02:44
    o direito de abolir finalmente o direito,
    00:02:46
    A capacidade de excluir uma coluna?
    00:02:48
    A primeira é que os dados
    00:02:51
    são desnecessários para o projeto.
    00:02:53
    Aqui estamos um a um,
    00:02:57
    em um resumo de vendas que
    00:02:59
    foram realizadas por uma empresa,
    00:03:01
    para ter, por exemplo, o número
    00:03:03
    dos telefones dos clientes.
    00:03:04
    Em uma ferramenta de visualização,
    00:03:06
    Não vai me fazer muito bem.
    00:03:09
    Então, por que manter esta coluna
    00:03:11
    lá que poluirá a minha pintura,
    00:03:13
    que potencialmente aumentará
    00:03:15
    também o meu arquivo,
    00:03:17
    então há potencialmente se for
    00:03:18
    inútil para o que estou tentando fazer,
    00:03:21
    Bem, eu posso excluir a coluna.
    00:03:24
    Observe que, se você ainda não está
    00:03:26
    certo de que a coluna é útil para você,
    00:03:29
    você pode deixá-lo e
    00:03:31
    depois apagá-lo, hein,
    00:03:32
    É bem possível fazer
    00:03:34
    supressões ligeiramente incrementais,
    00:03:36
    um pouco mais tarde no reprocessamento.
    00:03:39
    Outro elemento,
    00:03:40
    são duplicatas,
    00:03:41
    Por isso, acontece com muita frequência
    00:03:43
    Ao que muitas vezes nos conectamos
    00:03:44
    fontes técnicas,
    00:03:46
    Então é o fato de que 2
    00:03:49
    as colunas sobem visivelmente,
    00:03:50
    ou exactamente a mesma informação,
    00:03:52
    ou quase.
    00:03:53
    Então, após a questão do formato o
    00:03:55
    mesma informação, por exemplo,
    00:03:56
    aqui no caso eu dou esses 2
    00:03:59
    colunas que indiquem o mês da venda,
    00:04:00
    há um que está em formato escrito,
    00:04:02
    Então ele seria escrito anexado e o outro formato.
    00:04:04
    Não, ele será escrito 6 então normalmente há
    00:04:06
    Não é útil manter o 2
    00:04:08
    hein é a mesma informação.
    00:04:10
    Então, aqui o mais lógico,
    00:04:11
    é simplesmente para manter o
    00:04:13
    formato que melhor nos convier,
    00:04:14
    então, potencialmente, a figura,
    00:04:16
    porque eu tenderia a
    00:04:20
    fazer para e, em seguida, excluir
    00:04:22
    A coluna de teste de texto.
    00:04:24
    Dê um consistente,
    00:04:26
    Então, aqui nos encontramos em um
    00:04:29
    ou em 95% dos casos,
    00:04:31
    Os dados não estão disponíveis, portanto,
    00:04:33
    É realmente relevante
    00:04:35
    para manter uma coluna onde também há
    00:04:38
    Mais de tão poucos dados presentes
    00:04:40
    e assim lá no caso que eu dou
    00:04:43
    código o código vamos imaginar um código de barras?
    00:04:45
    O identificador é muito raramente preenchido
    00:04:49
    Então e o que eu realmente vou ser capaz de
    00:04:52
    explorar dados em 5% das linhas.
    00:04:54
    Talvez não
    00:04:55
    e, portanto, nesse caso, é mais
    00:04:57
    Sábio para excluir a coluna.
    00:04:59
    E o último elemento,
    00:05:01
    são dados de má qualidade,
    00:05:03
    Então, digamos que você tenha um
    00:05:05
    coluna rotulada como Código
    00:05:06
    postal e que de vez em quando,
    00:05:07
    Você vai encontrar bastante
    00:05:09
    o nome do armazém,
    00:05:11
    Então, de vez em quando,
    00:05:12
    Imaginemos mesmo em metade dos casos,
    00:05:14
    ou mesmo demais,
    00:05:14
    o nome da loja para que ele prove
    00:05:16
    um pouco de problema que
    00:05:18
    pode ter tido em torno desta coluna
    00:05:20
    lá e, portanto, potencialmente até mesmo o
    00:05:22
    códigos postais que estão presentes,
    00:05:23
    que normalmente seria o formato correto,
    00:05:25
    são potencialmente falsos e, portanto,
    00:05:27
    Tenha cuidado que pode ser perigoso.
    00:05:29
    Mais uma vez
    00:05:31
    Não é necessário excluir o
    00:05:33
    as colunas em caso de dúvida,
    00:05:36
    Você pode fazer isso um pouco mais tarde.
    00:05:37
    Mas, no geral, quando você tem um
    00:05:39
    um pouco a resposta em mente,
    00:05:41
    Bem, você pode diretamente
    00:05:43
    Exclua a coluna.
    00:05:45
    Então, para isso, nós vamos nos virar,
    00:05:47
    vamos para Power Quéry.
    00:05:53
    Aqui, é isso, vamos apreciá-lo em outro lugar
    00:05:56
    para renomear nosso conjunto de dados
    00:05:58
    que chamaremos aqui de festival. Aí está.
    00:06:05
    E vamos ser capazes de fazer um pouco
    00:06:07
    veja o nosso conjunto de dados,
    00:06:09
    então o nome do evento
    00:06:12
    Não tenho problema com isso.
    00:06:14
    Nem a região,
    00:06:16
    O domínio do suplemento de domínio.
    00:06:19
    Não parece muito cheio, então
    00:06:21
    Como eu sei o que é muito
    00:06:23
    cheio ou não cheio muito,
    00:06:25
    Então você tem esta sub-barra aqui
    00:06:26
    que lhe dará um certo número
    00:06:29
    informações muito interessantes.
    00:06:30
    Então, o fato de que nós vamos ter por
    00:06:34
    exemplo aqui 67% de Conclusão do
    00:06:37
    da coluna em 67% dos casos,
    00:06:40
    A linha tem um valor.
    00:06:42
    Ele também nos dará
    00:06:44
    um indicador de erro,
    00:06:46
    então potencialmente linhas
    00:06:47
    que contêm erros.
    00:06:48
    Veremos os tipos de erros
    00:06:50
    que são possíveis.
    00:06:51
    E, em seguida, o número de colunas vazias.
    00:06:54
    E que, de repente, você vê aqui então,
    00:06:55
    quando estiver verde,
    00:06:56
    Bem, esse é o,
    00:06:58
    o gabari de conclusão grossista de
    00:07:00
    o da coluna e não dá
    00:07:03
    Já aqui opções para excluir
    00:07:04
    por exemplo, elementos vazios,
    00:07:06
    assim, ou seja, as linhas que são,
    00:07:08
    que estão, portanto, obviamente lá,
    00:07:09
    aqui vamos nós,
    00:07:10
    Nós não vamos fazer isso porque temos
    00:07:12
    2/3 de colunas preenchidas de modo que
    00:07:14
    pode ser bastante relevante em
    00:07:15
    termos de em termos de exploração.
    00:07:17
    Outro ponto é importante,
    00:07:19
    Vemos que as colunas que
    00:07:21
    estão inicialmente vazios no.
    00:07:23
    No arquivo ter aqui sido
    00:07:25
    completado pelo valor zero,
    00:07:27
    Então isso é muito importante e você não
    00:07:30
    Nunca encontre um valor verdadeiramente vazio.
    00:07:32
    Realmente
    00:07:33
    Desde o poder de consulta
    00:07:34
    automaticamente e ser capaz de fazer bem,
    00:07:35
    Ele vai substituir isso por zero.
    00:07:37
    Não deve ser entendido por um texto real,
    00:07:40
    uma formulação real,
    00:07:41
    é apenas uma visão,
    00:07:44
    uma maneira de visualizar o valor,
    00:07:46
    O fato de que o valor está vazio.
    00:07:48
    Mas, como você vê,
    00:07:49
    está em itálico e, portanto,
    00:07:50
    não tem valor real.
    00:07:52
    Por outro lado, podemos fazer tudo para
    00:07:53
    faz dizer, por exemplo.
    00:07:54
    Excluo todos os valores nulos
    00:07:56
    de uma coluna e assim de repente ela nos dá
    00:07:59
    ajuda muito a ter uma denominação
    00:08:00
    para isso pela ausência de valor.
    00:08:04
    Depois teremos o departamento.
    00:08:08
    O período da cidade,
    00:08:09
    Então, sim, aqui,
    00:08:09
    Não é especialmente um problema.
    00:08:11
    A palavra usual no início,
    00:08:13
    Vemos que existem pequenos
    00:08:14
    preocupações com o formato da escola,
    00:08:14
    estávamos misturados com números e meses,
    00:08:18
    mas a informação é relevante,
    00:08:19
    Então vamos ver como o
    00:08:21
    Manipular o site por que não?
    00:08:23
    Seremos capazes de explorá-lo.
    00:08:25
    O número de identificação,
    00:08:27
    Então isso é muito importante,
    00:08:28
    Vamos mantê-lo também.
    00:08:30
    O principal município?
    00:08:32
    Outra comuna lá,
    00:08:33
    Este é o primeiro caso em que vamos
    00:08:35
    ter um pouco mais de problemas
    00:08:37
    para explorar porque já vai
    00:08:39
    ser bastante complicado de dizer
    00:08:40
    que em um festival vamos nos preocupar
    00:08:42
    Vários municípios, por exemplo
    00:08:43
    para exibir em um mapa,
    00:08:45
    será muito mais simples
    00:08:46
    ter apenas um ponto e
    00:08:48
    Além disso, no viaduto sobre o nosso.
    00:08:51
    Leia nossa coluna,
    00:08:53
    Vemos que está vazio em 90% dos casos,
    00:08:56
    Então, aqui estamos tipicamente em um caso em que
    00:08:59
    não é relevante para manter a coluna,
    00:09:02
    Então teremos vários métodos,
    00:09:04
    eh para excluir uma coluna,
    00:09:05
    o primeiro que eu te mostro aqui,
    00:09:06
    é simplesmente para selecioná-lo,
    00:09:09
    para fazer um clique com o botão direito do mouse que será aberto
    00:09:11
    Um painel de controle inteiro
    00:09:12
    que corresponde muito amplamente
    00:09:13
    o que você vai encontrar,
    00:09:15
    especialmente na aba de
    00:09:17
    transformação diretamente em em
    00:09:19
    o no poder eu e aqui vamos nós
    00:09:22
    Basta clicar em excluir.
    00:09:25
    Vemos que um passo acaba de ser adicionado,
    00:09:27
    hein, aqui.
    00:09:30
    E assim vamos continuar aqui
    00:09:34
    a nossa exploração,
    00:09:35
    então a data de início,
    00:09:37
    Então a gente vê que está faltando muito,
    00:09:39
    mas ainda está tudo bem
    00:09:40
    ser útil para mais tarde,
    00:09:41
    Porque, em particular, para fazer
    00:09:43
    representações no tempo de,
    00:09:44
    do volume do festival, então vamos mantê-lo.
    00:09:47
    A data de término, a data de criação,
    00:09:49
    o código postal muito bem,
    00:09:50
    Código postal e código INSEE.
    00:09:52
    Então, aqui no nosso caso,
    00:09:55
    Eu lhes digo,
    00:09:55
    Nós vamos principalmente fazer o trabalho de
    00:09:58
    do código postal para o código INSEE
    00:10:00
    É algo bem diferente.
    00:10:03
    Então é um,
    00:10:03
    Esta é outra maneira de
    00:10:05
    designar um município e que
    00:10:07
    não vai me interessar muito.
    00:10:09
    Então, aqui eu prefiro cuidar de
    00:10:12
    a ser suprimida esta coluna
    00:10:15
    Então, lá do código do código que é.
    00:10:18
    Porque se encaixa para mais ou
    00:10:20
    menos para mim a uma duplicata do código postal.
    00:10:23
    É apenas um formato um pouco mais complicado.
    00:10:27
    Então, outro método
    00:10:28
    para excluir uma coluna,
    00:10:30
    Então, aqui vamos selecioná-lo.
    00:10:32
    Vamos para a recepção
    00:10:33
    E vemos aqui que temos um item.
    00:10:35
    Gerencie as colunas e lá ele vai
    00:10:37
    ofereça-nos 2 coisas assim 2
    00:10:39
    optar por abolir a escola,
    00:10:41
    portanto, exclua as colunas.
    00:10:41
    Bah é bem simples hein,
    00:10:42
    Ele não removeu o
    00:10:44
    colunas que seleciono e
    00:10:46
    então FYI eu posso fazer tudo
    00:10:48
    feito por detenção de capital ou
    00:10:50
    Controlo sobre a minha avaliação no meu teclado
    00:10:53
    para poder selecionar 2 colunas,
    00:10:55
    volte aqui e clique.
    00:10:58
    Excluir colunas?
    00:10:59
    Então, e se eu fizer isso aqui?
    00:11:01
    Então, obviamente, pode voltar.
    00:11:02
    Esta será uma oportunidade para lhe mostrar.
    00:11:05
    Vemos que, Bem,
    00:11:06
    ele apagou os les,
    00:11:09
    as 2 colunas de uma só vez.
    00:11:10
    Então vamos voltar.
    00:11:13
    Voltaremos ao nosso código insee.
    00:11:17
    E vamos voltar aqui.
    00:11:20
    O campo que quero mostrar,
    00:11:22
    para gerenciar as colunas excluídas e
    00:11:23
    Agora eu tenho outra opção que
    00:11:25
    é excluir as outras colunas,
    00:11:27
    Então aí terá o efeito
    00:11:28
    exatamente invertido que vai ser
    00:11:30
    excluir todas as colunas, exceto
    00:11:31
    os que eu selecionei.
    00:11:32
    Portanto, o mesmo nós vamos aplicar, mas não
    00:11:34
    Pânico podemos voltar.
    00:11:36
    Então você vê aqui,
    00:11:38
    Ele só mantinha minhas colunas.
    00:11:42
    Então voltamos novamente.
    00:11:45
    E para lhe mostrar as últimas novidades
    00:11:47
    funcionalidade em torno de que nós
    00:11:49
    voltará ao nosso código em C
    00:11:51
    e nós vamos ter o inverso,
    00:11:53
    ou seja, escolha as colunas,
    00:11:54
    escolha as colunas,
    00:11:55
    Vai ser só para dizer,
    00:11:57
    Bem, eu escolho.
    00:11:59
    A coluna que me interessa aqui,
    00:12:01
    Vou ter um campo que vai abrir,
    00:12:02
    Então, lá, aqui,
    00:12:03
    Eu só tenho que desafixar os potenciais,
    00:12:07
    as colunas potenciais que
    00:12:08
    Não estou interessado.
    00:12:10
    E assim ele só irá até mim.
    00:12:11
    manter o que eu selecionei
    00:12:13
    e da mesma forma.
    00:12:17
    Se estou procurando uma coluna
    00:12:18
    Especialmente porque eu não
    00:12:20
    não o encontra na lista,
    00:12:21
    Eu serei capaz aqui, por exemplo,
    00:12:22
    Clique. Para o meu famoso código insee.
    00:12:30
    Então meu código PIN está aqui
    00:12:32
    o código é deixado aqui,
    00:12:33
    Eu seleciono e, portanto, quem vai
    00:12:35
    Leve-me diretamente para a coluna
    00:12:37
    para depois potencialmente o
    00:12:39
    excluir então aqui eu vou
    00:12:41
    Voltar para o meu salto de menu eu vou
    00:12:44
    Ter as colunas excluídas.
    00:12:47
    Ou não, escolha as colunas
    00:12:48
    Escolha as colunas.
    00:12:52
    E aí, a gente vê isso.
    00:12:55
    Os demais municípios porque
    00:12:56
    que eu apaguei a etapa,
    00:12:58
    está presente novamente,
    00:13:00
    Então aqui vou clicar em
    00:13:03
    Eu vou
    00:13:05
    Também desative o código INSEE.
    00:13:07
    Clico em OK.
    00:13:09
    E aí vemos que eu tenho um novo item
    00:13:12
    que acaba de ser removido.
    00:13:16
    E assim seremos capazes de
    00:13:17
    continuar o nosso trabalho,
    00:13:18
    Então, aqui temos a redação da comuna
    00:13:21
    Então, essa é a redação da comuna.
    00:13:23
    Para informação,
    00:13:24
    Nós já tínhamos isso aqui, então é
    00:13:26
    como um principal, então não muito
    00:13:29
    relevante para manter esta coluna
    00:13:30
    Então, aqui vamos fazer isso a partir de
    00:13:32
    maneira clássica por exclusão.
    00:13:36
    O que vem a seguir? Continuaremos a
    00:13:41
    então verifique o departamento SK,
    00:13:43
    é informação
    00:13:45
    que tivemos em outros lugares.
    00:13:47
    Um pouco mais adiante.
    00:13:51
    Este é o departamento que está aqui
    00:13:53
    então não há necessidade de manter.
    00:13:56
    Aquela coluna?
    00:13:58
    Você vê um em outro lugar que aqui
    00:14:01
    Colunas excluídas não são
    00:14:03
    que um único passo e vemos isso em
    00:14:06
    Essa folha aqui ele vai me dizer
    00:14:08
    então esse é o M, então é o
    00:14:11
    mashup é basicamente o código que
    00:14:12
    é gerado em cada um dos meus passos
    00:14:14
    então eu não me encaixo nisso de jeito nenhum
    00:14:15
    O detalhe por enquanto sobre isso
    00:14:16
    Teremos tempo para falar sobre isso novamente
    00:14:18
    mas, em qualquer caso, permite-lhe,
    00:14:19
    Se você chegar ao at,
    00:14:21
    Leia para saber um pouco
    00:14:23
    o que está acontecendo no estado.
    00:14:25
    Então, aqui,
    00:14:26
    Eu apaguei o departamento e K e
    00:14:30
    Depois temos o nosso volume de participantes.
    00:14:33
    2018 2017, então lá estamos muito bons,
    00:14:34
    Vamos fazer outra passagem.
    00:14:35
    O nome do evento
    00:14:36
    não tem nenhum problema,
    00:14:37
    a região do domínio completamente,
    00:14:38
    periodicidade do departamento de domínio,
    00:14:40
    mês de início, o site,
    00:14:43
    o número de identificação,
    00:14:44
    o município, o número da edição,
    00:14:46
    a data de início da data de termo,
    00:14:48
    a data de criação,
    00:14:49
    o código postal, o código INSEE,
    00:14:51
    o nome do departamento e o 2
    00:14:54
    Volumes de participantes para 2018.
    00:14:56
    Em 2017, portanto,
    00:14:57
    a partir daí,
    00:14:58
    Podemos considerar que excluímos
    00:15:00
    todas as colunas que não eram
    00:15:01
    não é necessário para o nosso projeto.

    Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
    Effectuez une autre recherche ou retournez au contenu !

     

    00:00:02
    Teraz, gdy
    00:00:03
    zapisuje nasz plik,
    00:00:04
    Będziemy mogli zacząć realizować
    00:00:06
    nasze pierwsze przetworzenie,
    00:00:07
    Więc w tym celu, kiedy już tu jesteśmy,
    00:00:08
    Zajmiemy się przekształcaniem danych.
    00:00:11
    Przekształcanie danych, które są przesyłane
    00:00:13
    pozwalają nam wyświetlić Power Quéry
    00:00:15
    i pierwszy ciekawy element,
    00:00:17
    Widzimy, że podjęto już kroki
    00:00:18
    ponownego przetwarzania, podczas gdy mamy
    00:00:20
    nic nie prosiło o zapamiętanie,
    00:00:21
    Właśnie zrobiliśmy ładunek
    00:00:23
    danych i dlatego to zrobiliśmy.
    00:00:24
    To było po to, aby pokazać ci dokładnie
    00:00:26
    Rodzaj inteligencji, która
    00:00:28
    może być przysłowiowy,
    00:00:29
    Więc w zasadzie to, o co prosiliśmy,
    00:00:31
    To jest ten pierwszy krok, który jest tutaj,
    00:00:32
    które jest źródłem danych huh.
    00:00:34
    Dla przypomnienia,
    00:00:35
    jeśli kliknę tutaj na bezzębnego Pedro,
    00:00:38
    Będziemy mieli ścieżkę
    00:00:39
    do pliku, jeśli zostaniesz oszukany,
    00:00:41
    Cóż, możesz kliknąć tutaj
    00:00:42
    podczas przeglądania. Zrobić to ponownie?
    00:00:46
    A potem przejdziemy do nawigacji,
    00:00:48
    Więc to normalne, huh,
    00:00:49
    Wtedy wybraliśmy
    00:00:51
    jeden, aby móc pracować i przez
    00:00:53
    Przeciwko temu, co interesujące, jest
    00:00:54
    że automatycznie wykrył
    00:00:56
    fakt, że tabela zawierała
    00:00:58
    To całkiem nieźle.
    00:01:00
    Jest to związane z faktem, że
    00:01:02
    w Excelu był bardzo dobrze przygotowany
    00:01:04
    w tym sensie, że zostało to zadeklarowane w
    00:01:07
    jako tabelę w Excelu, więc to
    00:01:10
    co wyjaśnia po tym pewne
    00:01:12
    inteligencja eh od Excela
    00:01:13
    to także Microsoft i widzimy
    00:01:15
    Kolejny element jest taki.
    00:01:17
    Zmienił się.
    00:01:18
    A typy niektórych,
    00:01:21
    niektóre kolumny,
    00:01:21
    Z drugiej strony,
    00:01:23
    To też trochę potrwa
    00:01:24
    bądź trochę ostrożny,
    00:01:25
    co może wywnioskować z pewnych rzeczy
    00:01:26
    którzy tam choć raz nie są
    00:01:29
    koniecznie prawda, więc będzie się wiązać;
    00:01:30
    W każdym razie, aby sprawdzić typ, huh.
    00:01:32
    Przypominamy, że
    00:01:33
    Typ znajduje się tutaj w każdej kolumnie
    00:01:36
    aby móc zmienić rodzaj
    00:01:38
    kolumny i to jest interesujące
    00:01:40
    właśnie po to, aby móc zrobić
    00:01:42
    sumy na przykład liczby,
    00:01:44
    liczby mocy,
    00:01:46
    Oblicz czas trwania między 2 datami.
    00:01:48
    Więc tutaj będziemy potrzebować dat.
    00:01:50
    Aby móc konkatenować
    00:01:52
    ekstrakcje za pomocą kolumny tekstowej,
    00:01:54
    et cetera, et cetera.
    00:01:56
    To bardzo ważny krok.
    00:01:58
    więc tutaj powiemy, że Moc
    00:02:01
    Mail wykonał swoją pracę raczej dobrze
    00:02:03
    i będziemy mogli zacząć trochę
    00:02:06
    Niewiele do kontynuowania modyfikacji.
    00:02:08
    Więc pierwszy krok, że
    00:02:10
    doradza ci tam w czasie, gdy masz
    00:02:12
    przyniósł swój pierwszy zestaw danych,
    00:02:14
    jest sortowanie kolumn
    00:02:16
    że odzyskałeś, gdy my
    00:02:19
    przeszukał plik w programie Excel,
    00:02:20
    Widzieliśmy, że potencjalnie mamy
    00:02:22
    Duplikaty.
    00:02:22
    Rzeczy, które niekoniecznie były
    00:02:24
    Ciekawe z do utrzymania w
    00:02:26
    w pliku i tak będziemy
    00:02:28
    Spróbuj zrozumieć trochę, w której
    00:02:30
    W przypadku, gdy kolumny powinny zostać usunięte.
    00:02:34
    Wtedy
    00:02:35
    Wyobraźmy sobie, że pracujemy nad
    00:02:37
    przeprowadzonych danych dotyczących sprzedaży
    00:02:39
    przez jedną, przez firmę.
    00:02:41
    Więc jakie są duże kroki figury
    00:02:43
    w którym możemy powiedzieć, że mamy
    00:02:44
    prawo do ostatecznego zniesienia prawicy,
    00:02:46
    Możliwość usunięcia kolumny?
    00:02:48
    Po pierwsze, dane
    00:02:51
    są niepotrzebne dla projektu.
    00:02:53
    Tutaj jesteśmy jeden na jednego,
    00:02:57
    w podsumowaniu sprzedaży, które
    00:02:59
    zostały przeprowadzone przez spółkę,
    00:03:01
    aby mieć na przykład liczbę
    00:03:03
    telefonów klientów.
    00:03:04
    W narzędziu do wizualizacji,
    00:03:06
    Nie przyniesie mi to wiele dobrego.
    00:03:09
    Po co więc trzymać tę kolumnę
    00:03:11
    tam, co zanieczyści mój obraz,
    00:03:13
    co potencjalnie wzrośnie
    00:03:15
    również mój plik,
    00:03:17
    Więc potencjalnie jeśli jest
    00:03:18
    bezużyteczny dla tego, co próbuję zrobić,
    00:03:21
    Cóż, mogę usunąć kolumnę.
    00:03:24
    Pamiętaj, że jeśli jeszcze nie jesteś
    00:03:26
    pewność, że kolumna jest dla Ciebie przydatna,
    00:03:29
    możesz go zostawić i
    00:03:31
    później usuń to, huh,
    00:03:32
    Jest to całkiem możliwe do zrobienia
    00:03:34
    nieznacznie przyrostowe usunięcia,
    00:03:36
    nieco później w przetwarzaniu.
    00:03:39
    Kolejny element,
    00:03:40
    to duplikaty,
    00:03:41
    Tak więc bardzo często zdarza się, aby
    00:03:43
    Z czym często się łączymy
    00:03:44
    źródła techniczne,
    00:03:46
    Tak więc faktem jest, że 2
    00:03:49
    kolumny idą zauważalnie w górę,
    00:03:50
    albo dokładnie te same informacje,
    00:03:52
    lub prawie.
    00:03:53
    Tak więc po pytaniu o format
    00:03:55
    Te same informacje, na przykład
    00:03:56
    tutaj w przypadku podaję te 2
    00:03:59
    kolumny podające miesiąc sprzedaży,
    00:04:00
    jest jeden, który jest w formie pisemnej,
    00:04:02
    Więc byłoby napisane załączone i inny format.
    00:04:04
    Nie, będzie napisane 6, więc zazwyczaj
    00:04:06
    Nie ma sensu zachowywać 2
    00:04:08
    huh, to te same informacje.
    00:04:10
    Więc tutaj najbardziej logiczne,
    00:04:11
    Chodzi po prostu o zachowanie
    00:04:13
    format, który najbardziej nam odpowiada,
    00:04:14
    więc potencjalnie liczba,
    00:04:16
    bo ja bym skłaniał się do
    00:04:20
    Wykonaj dla, a następnie usuń
    00:04:22
    Kolumna testu tekstu.
    00:04:24
    Daj spójne,
    00:04:26
    Tak więc tutaj znajdujemy się w
    00:04:29
    lub w 95% przypadków,
    00:04:31
    Dane nie są dostępne, więc
    00:04:33
    Czy to naprawdę istotne?
    00:04:35
    , aby zachować kolumnę, w której znajduje się również
    00:04:38
    Więcej niż mało danych
    00:04:40
    i tak tam w przypadku podaję
    00:04:43
    Kod Wyobraźmy sobie kod kreskowy?
    00:04:45
    Identyfikator jest bardzo rzadko wypełniany
    00:04:49
    Więc i co naprawdę będę w stanie
    00:04:52
    Wykorzystaj dane na 5% linii.
    00:04:54
    Może nie
    00:04:55
    a zatem w takim przypadku jest to więcej
    00:04:57
    Mądrze usunąć kolumnę.
    00:04:59
    I ostatni element,
    00:05:01
    są to dane niskiej jakości,
    00:05:03
    Powiedzmy, że masz
    00:05:05
    kolumna z etykietą Kod
    00:05:06
    pocztowe i to od czasu do czasu,
    00:05:07
    Znajdziesz raczej
    00:05:09
    nazwę sklepu,
    00:05:11
    Więc od czasu do czasu,
    00:05:12
    Wyobraźmy sobie nawet, że w połowie przypadków
    00:05:14
    lub nawet za dużo,
    00:05:14
    nazwa sklepu, aby to udowodnić
    00:05:16
    Mały problem, że
    00:05:18
    mógł mieć wokół tej kolumny
    00:05:20
    tam, a zatem potencjalnie nawet
    00:05:22
    obecne kody pocztowe,
    00:05:23
    który normalnie byłby właściwym formatem,
    00:05:25
    są potencjalnie fałszywe, a zatem
    00:05:27
    Uważaj, może to być niebezpieczne.
    00:05:29
    Jeszcze raz
    00:05:31
    Nie musisz usuwać
    00:05:33
    kolumny, gdy masz wątpliwości,
    00:05:36
    Możesz to zrobić trochę później.
    00:05:37
    Ale ogólnie rzecz biorąc, gdy masz
    00:05:39
    trochę odpowiedzi w umyśle,
    00:05:41
    Cóż, możesz bezpośrednio
    00:05:43
    Usuń kolumnę.
    00:05:45
    W tym celu zajmiemy się odwróceniem,
    00:05:47
    Przejdziemy do Power Quéry.
    00:05:53
    Tutaj, to wszystko, będziemy się nim cieszyć gdzie indziej
    00:05:56
    Aby zmienić nazwę naszego zestawu danych
    00:05:58
    który nazwiemy tutaj festiwalem. Proszę bardzo.
    00:06:05
    I będziemy w stanie zrobić trochę
    00:06:07
    spójrz na nasz zestaw danych,
    00:06:09
    Czyli nazwa wydarzenia
    00:06:12
    Nie mam z tym problemu.
    00:06:14
    Ani region,
    00:06:16
    Domena dodatku domeny.
    00:06:19
    Nie wygląda na pełny, więc
    00:06:21
    Skąd wiem, co jest dużo
    00:06:23
    wypełnione lub nie wypełnione dużo,
    00:06:25
    Więc masz tutaj ten podpasek
    00:06:26
    co da ci określoną liczbę
    00:06:29
    Bardzo ciekawe informacje.
    00:06:30
    Więc fakt, że będziemy mieli przez
    00:06:34
    przykład tutaj 67% ukończenia
    00:06:37
    kolumny w 67% przypadków,
    00:06:40
    Wiersz ma wartość.
    00:06:42
    On też nam da
    00:06:44
    wskaźnik błędu,
    00:06:46
    więc potencjalnie linie
    00:06:47
    które zawierają błędy.
    00:06:48
    Zobaczymy rodzaje błędów
    00:06:50
    które są możliwe.
    00:06:51
    A następnie liczba pustych kolumn.
    00:06:54
    I że nagle, widzicie tutaj,
    00:06:55
    kiedy jest zielony,
    00:06:56
    Cóż, to jest,
    00:06:58
    wskaźnik realizacji hurtowej
    00:07:00
    kolumny i nie daje
    00:07:03
    Już tutaj opcje do usunięcia
    00:07:04
    na przykład puste elementy,
    00:07:06
    a mianowicie linie, które są,
    00:07:08
    które w związku z tym w oczywisty sposób tam są,
    00:07:09
    Zaczynamy,
    00:07:10
    Nie zrobimy tego, ponieważ mamy
    00:07:12
    2/3 kolumn wypełnionych tak, aby
    00:07:14
    może być bardzo istotne w
    00:07:15
    warunki w zakresie eksploatacji.
    00:07:17
    Kolejna kwestia jest ważna,
    00:07:19
    Widzimy, że kolumny, które
    00:07:21
    są początkowo puste w.
    00:07:23
    W pliku zostały tutaj
    00:07:25
    uzupełnione o wartość zero,
    00:07:27
    To bardzo ważne, a wy nie
    00:07:30
    Nigdy nie znajdź naprawdę pustej wartości.
    00:07:32
    Rzeczywiście
    00:07:33
    Od czasu zasilania zapytań
    00:07:34
    automatycznie i być w stanie dobrze sobie radzić,
    00:07:35
    Zastąpi to zerem.
    00:07:37
    Nie powinno to być rozumiane przez prawdziwy tekst,
    00:07:40
    rzeczywiste sformułowanie,
    00:07:41
    To tylko wizja,
    00:07:44
    sposób wizualizacji wartości,
    00:07:46
    Fakt, że wartość jest pusta.
    00:07:48
    Ale jak widzisz,
    00:07:49
    Jest zapisany kursywą i dlatego
    00:07:50
    nie ma realnej wartości.
    00:07:52
    Z drugiej strony możemy zrobić wszystko, aby
    00:07:53
    Na przykład mówi.
    00:07:54
    Usuwam wszystkie wartości null
    00:07:56
    kolumny i tak nagle daje nam
    00:07:59
    Bardzo pomaga mieć apelację
    00:08:00
    do tego za brak wartości.
    00:08:04
    Potem będziemy mieli dział.
    00:08:08
    Okres miasta,
    00:08:09
    Więc tak, tutaj,
    00:08:09
    Nie stanowi to szczególnego problemu.
    00:08:11
    Zwykłe słowo na początku,
    00:08:13
    Widzimy, że są małe
    00:08:14
    dotyczy formatu szkoły,
    00:08:14
    byliśmy mieszani z liczbami i miesiącami,
    00:08:18
    ale informacje są istotne,
    00:08:19
    Zobaczymy więc, jak
    00:08:21
    Manipuluj stroną internetową, dlaczego nie?
    00:08:23
    Będziemy mogli to wykorzystać.
    00:08:25
    numer identyfikacyjny,
    00:08:27
    To bardzo ważne,
    00:08:28
    My też to zachowamy.
    00:08:30
    Główna gmina?
    00:08:32
    Inna gmina tam,
    00:08:33
    Jest to pierwszy przypadek, w którym
    00:08:35
    masz trochę więcej kłopotów
    00:08:37
    do wykorzystania, bo już będzie
    00:08:39
    być dość skomplikowanym do powiedzenia
    00:08:40
    że na festiwalu będziemy się martwić
    00:08:42
    Na przykład kilka gmin
    00:08:43
    do wyświetlania na mapie,
    00:08:45
    Będzie znacznie prościej
    00:08:46
    mieć tylko jeden punkt i
    00:08:48
    Oprócz tego na wiadukcie na naszym naszym.
    00:08:51
    Przeczytaj naszą kolumnę,
    00:08:53
    Widzimy, że w 90% przypadków jest pusty,
    00:08:56
    Więc tutaj zazwyczaj mamy do czynienia z przypadkiem, w którym
    00:08:59
    nie ma znaczenia dla zachowania kolumny,
    00:09:02
    Będziemy więc mieli kilka metod,
    00:09:04
    eh, aby usunąć kolumnę,
    00:09:05
    pierwszy pokazuję wam tutaj,
    00:09:06
    jest po prostu wybranie go,
    00:09:09
    , aby kliknąć prawym przyciskiem myszy, który zostanie otwarty
    00:09:11
    Cały panel sterowania
    00:09:12
    co odpowiada bardzo szeroko
    00:09:13
    co znajdziesz,
    00:09:15
    zwłaszcza w zakładce
    00:09:17
    transformacja bezpośrednio w
    00:09:19
    w mocy I i oto idziemy
    00:09:22
    Wystarczy kliknąć przycisk Usuń.
    00:09:25
    Widzimy, że właśnie dodano krok,
    00:09:27
    Huh, tutaj.
    00:09:30
    Będziemy więc kontynuować tutaj
    00:09:34
    nasze poszukiwania,
    00:09:35
    więc data rozpoczęcia,
    00:09:37
    Widzimy więc, że wiele brakuje,
    00:09:39
    Ale nadal jest w porządku
    00:09:40
    przydać się na później,
    00:09:41
    Ponieważ w szczególności do zrobienia
    00:09:43
    reprezentacje w czasie,
    00:09:44
    wolumenu festiwalu, więc go zatrzymamy.
    00:09:47
    Data zakończenia, data utworzenia,
    00:09:49
    kod pocztowy bardzo dobrze,
    00:09:50
    Kod pocztowy i kod INSEE.
    00:09:52
    Więc tutaj w naszym przypadku,
    00:09:55
    Mówię wam,
    00:09:55
    Będziemy głównie wykonywać pracę z
    00:09:58
    kodu pocztowego, a więc kod INSEE
    00:10:00
    To coś zupełnie innego.
    00:10:03
    Więc to jest,
    00:10:03
    Jest to inny sposób
    00:10:05
    wyznaczyć gminę i że
    00:10:07
    nie zainteresuje mnie zbytnio.
    00:10:09
    Więc tutaj raczej będę skłaniał się do
    00:10:12
    do usunięcia tej kolumny
    00:10:15
    Więc tam kod kodu to jest.
    00:10:18
    Ponieważ pasuje do więcej lub
    00:10:20
    mniej dla mnie do duplikatu kodu pocztowego.
    00:10:23
    To tylko nieco bardziej skomplikowany format.
    00:10:27
    Kolejna metoda
    00:10:28
    , aby usunąć kolumnę,
    00:10:30
    Więc tutaj go wybierzemy.
    00:10:32
    Idziemy do recepcji
    00:10:33
    I widzimy tutaj, że mamy przedmiot.
    00:10:35
    Zarządzaj kolumnami, a tam będzie
    00:10:37
    Zaoferuj nam 2 rzeczy, więc 2
    00:10:39
    zdecydować o likwidacji szkoły,
    00:10:41
    Więc usuń kolumny.
    00:10:41
    Bah to całkiem proste, huh,
    00:10:42
    Nie usunął
    00:10:44
    kolumny zaznaczam i
    00:10:46
    więc FYI mogę zrobić wszystko
    00:10:48
    dokonanej poprzez posiadanie kapitału lub
    00:10:50
    Kontrola nad moją recenzją na klawiaturze
    00:10:53
    aby móc wybrać 2 kolumny,
    00:10:55
    Wróć tutaj i kliknij.
    00:10:58
    Usunąć kolumny?
    00:10:59
    Co z tego, że zrobię to tutaj?
    00:11:01
    Więc oczywiście może wrócić.
    00:11:02
    To będzie okazja, aby ci pokazać.
    00:11:05
    Widzimy, że cóż,
    00:11:06
    usunął les,
    00:11:09
    2 kolumny naraz.
    00:11:10
    Więc wrócimy.
    00:11:13
    Wrócimy do naszego kodu insee.
    00:11:17
    Wrócimy do tego tematu.
    00:11:20
    Pole, które chcę pokazać,
    00:11:22
    więc zarządzaj usuniętymi kolumnami i
    00:11:23
    Teraz mam inną opcję, która
    00:11:25
    to usunięcie pozostałych kolumn,
    00:11:27
    Więc tam będzie to miało efekt
    00:11:28
    dokładnie odwrotnie, co będzie
    00:11:30
    usuń wszystkie kolumny z wyjątkiem
    00:11:31
    te, które wybrałem.
    00:11:32
    Więc to samo będziemy stosować, ale nie
    00:11:34
    Panika, możemy wrócić.
    00:11:36
    Więc widzicie tutaj,
    00:11:38
    Trzymał tylko moje kolumny.
    00:11:42
    Więc wracamy ponownie.
    00:11:45
    I pokazać najnowsze
    00:11:47
    Funkcjonalność wokół tego mamy
    00:11:49
    wróci do naszego kodu w C
    00:11:51
    i będziemy mieli gołą odwrotność,
    00:11:53
    tj. wybrać kolumny,
    00:11:54
    wybrać kolumny,
    00:11:55
    To będzie tylko powiedzieć,
    00:11:57
    Cóż, wybieram.
    00:11:59
    Felietnik, który mnie tu interesuje,
    00:12:01
    Będę miał pole, które się otworzy,
    00:12:02
    Więc tam, tutaj,
    00:12:03
    Muszę tylko odpiąć potencjały,
    00:12:07
    potencjalne kolumny, które
    00:12:08
    Nie jestem zainteresowany.
    00:12:10
    I tak pójdzie tylko do mnie.
    00:12:11
    zachowaj ten, który wybrałem
    00:12:13
    i w ten sam sposób.
    00:12:17
    Jeśli szukam kolumny
    00:12:18
    Zwłaszcza, że nie
    00:12:20
    nie znajduje go na liście,
    00:12:21
    Będę mógł tutaj na przykład,
    00:12:22
    Klikać. Do mojego słynnego kodu insee.
    00:12:30
    Więc mój kod PIN jest tutaj
    00:12:32
    kod pozostawiono tutaj,
    00:12:33
    Ja wybieram i dlatego kto to zrobi
    00:12:35
    Zabierz mnie bezpośrednio do kolumny
    00:12:37
    dla po potencjalnie
    00:12:39
    usuń, więc tutaj będę
    00:12:41
    Wróć do mojego menu, hop I will
    00:12:44
    Usuń kolumny.
    00:12:47
    Lub nie, wybierz kolumny
    00:12:48
    Wybierz kolumny.
    00:12:52
    I tu to widzimy.
    00:12:55
    Pozostałe gminy, ponieważ
    00:12:56
    że usunąłem krok,
    00:12:58
    jest ponownie obecny,
    00:13:00
    Więc tutaj kliknę na
    00:13:03
    Dobrze
    00:13:05
    Odłącz również kod INSEE.
    00:13:07
    Klikam OK.
    00:13:09
    I tak widzimy, że mam nowy przedmiot
    00:13:12
    który właśnie został usunięty.
    00:13:16
    I tak będziemy mogli
    00:13:17
    kontynuować naszą pracę,
    00:13:18
    Mamy tu więc sformułowanie komuny
    00:13:21
    Takie jest sformułowanie komuny.
    00:13:23
    Dla informacji,
    00:13:24
    Mieliśmy go już tutaj, więc jest
    00:13:26
    jako główny więc niezbyt
    00:13:29
    istotne dla zachowania tej kolumny
    00:13:30
    Więc tutaj zrobimy to z
    00:13:32
    Klasyczny sposób przez usunięcie.
    00:13:36
    Co dalej? Będziemy kontynuować
    00:13:41
    więc sprawdź dział SK,
    00:13:43
    To informacja
    00:13:45
    które mieliśmy gdzie indziej.
    00:13:47
    Trochę dalej.
    00:13:51
    To jest dział, który jest tutaj
    00:13:53
    więc nie musisz trzymać.
    00:13:56
    Ta kolumna?
    00:13:58
    Widzisz jeden gdzie indziej, że tutaj
    00:14:01
    Usunięte kolumny nie są
    00:14:03
    że jeden krok i widzimy to w
    00:14:06
    Ten arkusz tutaj mi powie
    00:14:08
    więc to jest M, więc to jest
    00:14:11
    Mashup to w zasadzie kod, który
    00:14:12
    jest generowany przy każdym z moich kroków
    00:14:14
    więc w ogóle do niego nie pasuję
    00:14:15
    Szczegóły na razie na ten temat
    00:14:16
    Będziemy mieli czas, aby porozmawiać o tym ponownie
    00:14:18
    ale w każdym razie pozwala ci,
    00:14:19
    Jeśli przyjedziesz do at,
    00:14:21
    Przeczytaj to, aby dowiedzieć się trochę
    00:14:23
    co się dzieje w państwie.
    00:14:25
    Więc tutaj,
    00:14:26
    Usunąłem dział i K i
    00:14:30
    Następnie mamy naszą liczbę uczestników.
    00:14:33
    2018 2017 więc jesteśmy całkiem nieźli,
    00:14:34
    Zrobimy kolejną przepustkę.
    00:14:35
    Nazwa wydarzenia
    00:14:36
    nie ma problemu,
    00:14:37
    region domeny całkowicie,
    00:14:38
    okresowość działu domenowego,
    00:14:40
    miesiąc rozpoczęcia, strona internetowa,
    00:14:43
    numer identyfikacyjny,
    00:14:44
    gminę, numer wydania,
    00:14:46
    datę rozpoczęcia daty zakończenia,
    00:14:48
    datę utworzenia,
    00:14:49
    kod pocztowy, kod INSEE,
    00:14:51
    nazwę departamentu i 2
    00:14:54
    Wolumen uczestników w 2018 roku.
    00:14:56
    W związku z tym w 2017 r.
    00:14:57
    stamtąd,
    00:14:58
    Możemy uznać, że usunęliśmy
    00:15:00
    wszystkie kolumny, które nie były
    00:15:01
    nie jest to konieczne dla naszego projektu.

    Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
    Effectuez une autre recherche ou retournez au contenu !

     

    00:00:02
    तो, अब जब हम
    00:00:03
    हमारी फ़ाइल सहेजता है,
    00:00:04
    हम महसूस करना शुरू करने में सक्षम होंगे
    00:00:06
    हमारा पहला पुनर्संसाधन,
    00:00:07
    इसके लिए, एक बार जब हम यहाँ होते हैं,
    00:00:08
    हम डेटा को बदलने जा रहे हैं।
    00:00:11
    जाने वाले डेटा को बदलें
    00:00:13
    हमें Power Quéry प्रदर्शित करने की अनुमति दें
    00:00:15
    और पहला दिलचस्प तत्व,
    00:00:17
    हम देखते हैं कि पहले से ही कदम उठाए गए हैं
    00:00:18
    पुनर्संसाधन की अवधि, जबकि हमारे पास
    00:00:20
    याद करने के लिए कुछ भी नहीं पूछा,
    00:00:21
    हमने बस एक भार किया
    00:00:23
    डेटा और यही कारण है कि हमने ऐसा किया।
    00:00:24
    यह आपको सटीक रूप से दिखाने के लिए था
    00:00:26
    इस तरह की बुद्धिमत्ता कि
    00:00:28
    लौकिक में हो सकता है,
    00:00:29
    तो हम मूल रूप से जो हमने मांगा था,
    00:00:31
    यह पहला कदम है जो यहां है,
    00:00:32
    जो डेटा स्रोत है।
    00:00:34
    तो एक अनुस्मारक के रूप में,
    00:00:35
    अगर मैं दंतहीन पेड्रो पर यहां क्लिक करता हूं,
    00:00:38
    हमारे पास रास्ता होने जा रहा है
    00:00:39
    फ़ाइल में यदि आपको धोखा दिया जाता है,
    00:00:41
    खैर आप यहाँ क्लिक कर सकते हैं
    00:00:42
    ब्राउज़ पर. इसे फिर से करने के लिए?
    00:00:46
    और फिर हम नेविगेशन पर जाएंगे,
    00:00:48
    तो यह सामान्य है, है ना,
    00:00:49
    यह तब है जब हमने चुना
    00:00:51
    काम करने में सक्षम होना और
    00:00:53
    जो दिलचस्प है उसके खिलाफ है
    00:00:54
    कि यह स्वचालित रूप से पता चला
    00:00:56
    तथ्य यह है कि तालिका में शामिल हैं
    00:00:58
    तो यह बहुत अच्छा है.
    00:01:00
    यह इस तथ्य से संबंधित है कि
    00:01:02
    एक्सेल में बहुत अच्छी तरह से तैयार किया गया था
    00:01:04
    इस अर्थ में कि यह घोषित किया गया था
    00:01:07
    एक्सेल में एक तालिका के रूप में इसलिए
    00:01:10
    जो इस निश्चितता के बाद बताता है
    00:01:12
    Excel के बाद से इंटेलिजेंस
    00:01:13
    यह माइक्रोसॉफ्ट भी है और हम देखते हैं
    00:01:15
    एक और तत्व यह है।
    00:01:17
    वह बदल गया।
    00:01:18
    और कुछ के प्रकार,
    00:01:21
    कुछ कॉलम,
    00:01:21
    तो दूसरी तरफ,
    00:01:23
    इसमें थोड़ा समय भी लगेगा
    00:01:24
    इससे थोड़ा सावधान रहो,
    00:01:25
    वह कुछ चीजों से क्या निष्कर्ष निकाल सकता है
    00:01:26
    जो एक बार के लिए वहां नहीं हैं
    00:01:29
    आवश्यक रूप से सच है इसलिए इसमें शामिल होगा
    00:01:30
    वैसे भी प्रकार की जांच करने के लिए हुह।
    00:01:32
    एक अनुस्मारक के रूप में,
    00:01:33
    प्रकार यहाँ प्रत्येक स्तंभ पर है
    00:01:36
    के प्रकार को बदलने में सक्षम होने के लिए,
    00:01:38
    कॉलम की और यह दिलचस्प है
    00:01:40
    ठीक से बनाने में सक्षम होना
    00:01:42
    उदाहरण के लिए संख्याओं पर योग,
    00:01:44
    बिजली की संख्या,
    00:01:46
    2 तिथियों के बीच की अवधि की गणना करें।
    00:01:48
    तो यहां हमें तारीखों की आवश्यकता होगी।
    00:01:50
    कांकेशंस बनाने में सक्षम होना
    00:01:52
    पाठ कॉलम के माध्यम से निष्कर्षण,
    00:01:54
    वगैरह, वगैरह।
    00:01:56
    इसलिए यह एक बहुत महत्वपूर्ण कदम है।
    00:01:58
    तो यहां हम कहेंगे कि शक्ति
    00:02:01
    मेल ने अपना काम बहुत अच्छी तरह से किया है
    00:02:03
    और हम थोड़ा शुरू करने में सक्षम होंगे
    00:02:06
    संशोधनों को जारी रखने के लिए बहुत कम है।
    00:02:08
    तो पहला कदम जो मैंने उठाया
    00:02:10
    आपके पास जो समय है, उस समय आपको सलाह देता है
    00:02:12
    अपना पहला डेटासेट लाया,
    00:02:14
    कॉलम के माध्यम से क्रमबद्ध करना है
    00:02:16
    जब हम ठीक हो गए तो आप ठीक हो गए
    00:02:19
    Excel में फ़ाइल क्रॉल कर दी है,
    00:02:20
    हमने देखा कि हमने संभावित रूप से
    00:02:22
    डुप्लिकेट।
    00:02:22
    चीजें जो जरूरी नहीं थीं
    00:02:24
    इसमें बने रहने के लिए दिलचस्प है
    00:02:26
    फाइल में है और इसलिए हम करेंगे
    00:02:28
    थोड़ा समझने की कोशिश करें जिसमें
    00:02:30
    मामले में कॉलम हटा दिए जाने चाहिए।
    00:02:34
    तब
    00:02:35
    आइए कल्पना करें कि हम इस पर काम कर रहे हैं
    00:02:37
    किए गए बिक्री डेटा की संख्या
    00:02:39
    एक से, एक कंपनी द्वारा।
    00:02:41
    तो क्या हैं आंकड़े के बड़े स्टेप्स
    00:02:43
    जिसमें हम कह सकते हैं कि हमारे पास है
    00:02:44
    अंत में अधिकार को समाप्त करने का अधिकार,
    00:02:46
    स्तंभ को हटाने की क्षमता?
    00:02:48
    पहला यह है कि डेटा
    00:02:51
    परियोजना के लिए अनावश्यक हैं।
    00:02:53
    यहाँ हम एक पर एक हैं,
    00:02:57
    बिक्री सारांश पर कि
    00:02:59
    एक कंपनी द्वारा किया गया था,
    00:03:01
    उदाहरण के लिए, संख्या होना चाहिए
    00:03:03
    ग्राहकों के फोन की संख्या
    00:03:04
    विज़ुअलाइज़ेशन टूल में,
    00:03:06
    इससे मुझे ज्यादा फायदा नहीं होने वाला है।
    00:03:09
    तो इस कॉलम को क्यों रखें
    00:03:11
    वहां जो मेरी पेंटिंग को प्रदूषित करेगा,
    00:03:13
    जो संभावित रूप से बढ़ेगा
    00:03:15
    मेरी फाइल भी,
    00:03:17
    तो संभावित रूप से अगर यह है
    00:03:18
    मैं जो करने की कोशिश कर रहा हूं उसके लिए बेकार,
    00:03:21
    खैर मैं कॉलम हटा सकता हूं।
    00:03:24
    ध्यान दें कि यदि आप अभी तक नहीं हैं
    00:03:26
    निश्चित है कि कॉलम आपके लिए उपयोगी है,
    00:03:29
    आप इसे छोड़ सकते हैं और
    00:03:31
    बाद में इसे हटा दें, हुह,
    00:03:32
    इसे बनाना काफी संभव है
    00:03:34
    थोड़ा वृद्धिशील विलोपन,
    00:03:36
    थोड़ी देर बाद रीप्रोसेसिंग में।
    00:03:39
    एक और तत्व,
    00:03:40
    यह डुप्लिकेट है,
    00:03:41
    तो यह बहुत बार होता है
    00:03:43
    हम अक्सर किससे जुड़ते हैं
    00:03:44
    तकनीकी स्रोत,
    00:03:46
    तो यह तथ्य है कि 2
    00:03:49
    स्तंभ उल्लेखनीय रूप से ऊपर जाते हैं,
    00:03:50
    या तो बिल्कुल एक ही जानकारी,
    00:03:52
    या लगभग।
    00:03:53
    तो प्रारूप के सवाल के बाद
    00:03:55
    उदाहरण के लिए एक ही जानकारी
    00:03:56
    यहां मामले में मैं ये 2 देता हूं
    00:03:59
    बिक्री का महीना देने वाले कॉलम,
    00:04:00
    एक है जो लिखित प्रारूप में है,
    00:04:02
    इसलिए इसे संलग्न और अन्य प्रारूप में लिखा जाएगा।
    00:04:04
    नहीं, यह 6 लिखा जाएगा इसलिए आम तौर पर
    00:04:06
    2 को रखना उपयोगी नहीं है
    00:04:08
    यह एक ही जानकारी है।
    00:04:10
    तो यहाँ सबसे तार्किक,
    00:04:11
    यह केवल रखने के लिए है
    00:04:13
    प्रारूप जो हमें सबसे अच्छा लगता है,
    00:04:14
    तो संभावित रूप से आंकड़ा,
    00:04:16
    क्योंकि मैं ऐसा करता हूं
    00:04:20
    इसके लिए करें और फिर हटाएँ
    00:04:22
    पाठ परीक्षण स्तंभ.
    00:04:24
    एक सुसंगत दें,
    00:04:26
    तो यहां हम खुद को एक में पाते हैं
    00:04:29
    कॉलम या 95% मामलों में,
    00:04:31
    डेटा उपलब्ध नहीं है, इसलिए
    00:04:33
    क्या यह वास्तव में प्रासंगिक है?
    00:04:35
    एक स्तंभ रखने के लिए जहां वहाँ भी है
    00:04:38
    कम डेटा मौजूद है
    00:04:40
    और इसलिए उस मामले में मैं देता हूं
    00:04:43
    कोड कोड आइए बारकोड की कल्पना करें?
    00:04:45
    पहचानकर्ता बहुत कम भरा जाता है
    00:04:49
    तो और मैं वास्तव में क्या करने जा रहा हूं
    00:04:52
    लाइनों के 5% पर डेटा का फायदा उठाएं।
    00:04:54
    शायद नहीं
    00:04:55
    और इसलिए किस मामले में यह अधिक है
    00:04:57
    कॉलम को हटाने के लिए बुद्धिमानी है।
    00:04:59
    और अंतिम तत्व,
    00:05:01
    यह खराब गुणवत्ता डेटा है,
    00:05:03
    तो मान लें कि आपके पास एक है
    00:05:05
    कोड लेबल वाला स्तंभ
    00:05:06
    डाक और वह समय-समय पर,
    00:05:07
    आपको इसके बजाय मिलेगा
    00:05:09
    दुकान का नाम,
    00:05:11
    तो समय-समय पर,
    00:05:12
    आइए हम आधे मामलों में भी कल्पना करें,
    00:05:14
    या यहां तक कि बहुत ज्यादा,
    00:05:14
    दुकान का नाम इसलिए साबित होता है
    00:05:16
    थोड़ी सी समस्या यह है कि
    00:05:18
    हो सकता है कि इस स्तंभ के आस-पास रहा हो
    00:05:20
    वहां और इसलिए संभावित रूप से यहां तक कि
    00:05:22
    डाक कोड जो मौजूद हैं,
    00:05:23
    जो आम तौर पर सही प्रारूप होगा,
    00:05:25
    संभावित रूप से झूठे हैं और इसलिए
    00:05:27
    सावधान रहें कि यह खतरनाक हो सकता है।
    00:05:29
    एक बार और
    00:05:31
    आपको इसे हटाने की आवश्यकता नहीं है
    00:05:33
    कॉलम जब आपको संदेह होता है,
    00:05:36
    आप इसे थोड़ी देर बाद कर सकते हैं।
    00:05:37
    लेकिन कुल मिलाकर, जब आपके पास एक है
    00:05:39
    थोड़ा सा जवाब दिमाग में है,
    00:05:41
    ठीक है, आप सीधे कर सकते हैं
    00:05:43
    स्तंभ हटाएँ.
    00:05:45
    तो इसके लिए, हम पलटने जा रहे हैं,
    00:05:47
    हम पावर क्वेरी में जा रहे हैं।
    00:05:53
    यहाँ, यही वह है, हम इसे कहीं और आनंद लेंगे
    00:05:56
    हमारे डेटासेट का नाम बदलने के लिए
    00:05:58
    जिसे हम यहां फेस्टिवल कहेंगे। तुम वहाँ जाओ।
    00:06:05
    और हम थोड़ा सा करने में सक्षम होने जा रहे हैं
    00:06:07
    हमारे डेटासेट को देखो,
    00:06:09
    तो घटना का नाम
    00:06:12
    मुझे इससे कोई समस्या नहीं है।
    00:06:14
    क्षेत्र भी नहीं है,
    00:06:16
    डोमेन ऐड-इन डोमेन.
    00:06:19
    यह बहुत भरा हुआ नहीं दिखता है
    00:06:21
    मुझे कैसे पता है कि क्या बहुत कुछ है
    00:06:23
    भरा हुआ या ज्यादा भरा नहीं,
    00:06:25
    तो आपके पास यह सब-बार यहां है
    00:06:26
    जो आपको एक निश्चित संख्या देगा
    00:06:29
    बहुत ही रोचक जानकारी।
    00:06:30
    तो तथ्य यह है कि हम किसके पास जा रहे हैं?
    00:06:34
    उदाहरण के लिए यहां पूरा होने का 67%
    00:06:37
    67% मामलों में कॉलम की संख्या,
    00:06:40
    पंक्ति का एक मान है।
    00:06:42
    वह हमें भी देगा।
    00:06:44
    एक त्रुटि संकेतक,
    00:06:46
    तो संभावित लाइनें
    00:06:47
    जिसमें त्रुटियां हैं।
    00:06:48
    हम त्रुटियों के प्रकार देखेंगे
    00:06:50
    ये ऐसे हैं जो संभव हैं।
    00:06:51
    और फिर खाली स्तंभों की संख्या।
    00:06:54
    और वह, अचानक, आप यहां देखते हैं,
    00:06:55
    जब यह हरा होता है,
    00:06:56
    खैर, यह है,
    00:06:58
    थोक पूरा होने का गेज
    00:07:00
    कॉलम का विवरण और यह नहीं देता है
    00:07:03
    पहले से ही हटाने के लिए यहां विकल्प हैं
    00:07:04
    उदाहरण के लिए, खाली तत्व,
    00:07:06
    तो अर्थात् वे पंक्तियाँ जो हैं,
    00:07:08
    जो इसलिए स्पष्ट रूप से वहां हैं,
    00:07:09
    हम जा रहे हैं
    00:07:10
    हम ऐसा नहीं करने जा रहे हैं क्योंकि हमारे पास है
    00:07:12
    कॉलम का 2/3 भरा गया ताकि
    00:07:14
    इसमें काफी प्रासंगिक हो सकता है
    00:07:15
    शोषण के संदर्भ में शर्तें।
    00:07:17
    एक और मुद्दा महत्वपूर्ण है,
    00:07:19
    हम देखते हैं कि कॉलम जो
    00:07:21
    शुरू में खाली हैं।
    00:07:23
    फाइल में यहां
    00:07:25
    मान शून्य द्वारा पूरा किया गया,
    00:07:27
    तो यह बहुत महत्वपूर्ण है और आप नहीं करते हैं
    00:07:30
    कभी भी वास्तव में खाली मूल्य न ढूंढें।
    00:07:32
    सचमुच
    00:07:33
    चूंकि क्वेरी शक्ति
    00:07:34
    स्वचालित रूप से और अच्छा करने में सक्षम हो,
    00:07:35
    वह इसे शून्य से बदलने जा रहा है।
    00:07:37
    यह एक वास्तविक पाठ से समझा नहीं जाना चाहिए,
    00:07:40
    एक असली शब्द,
    00:07:41
    यह सिर्फ एक दृष्टि है,
    00:07:44
    मूल्य की कल्पना करने का एक तरीका,
    00:07:46
    तथ्य यह है कि मूल्य खाली है।
    00:07:48
    लेकिन जैसा कि आप देखते हैं,
    00:07:49
    यह इटैलिक में है और इसलिए यह
    00:07:50
    इसका कोई वास्तविक मूल्य नहीं है।
    00:07:52
    दूसरी ओर, हम सब कुछ कर सकते हैं
    00:07:53
    उदाहरण के लिए कहता है।
    00:07:54
    मैं सभी शून्य मान हटाता हूँ
    00:07:56
    एक स्तंभ है और इसलिए अचानक यह हमें देता है
    00:07:59
    अपील करने में बहुत मदद करता है
    00:08:00
    इसके लिए मूल्य की अनुपस्थिति के लिए।
    00:08:04
    फिर हमारे पास विभाग होगा।
    00:08:08
    शहर की अवधि,
    00:08:09
    तो हाँ, यहाँ,
    00:08:09
    विशेष रूप से एक समस्या नहीं है।
    00:08:11
    शुरुआत में सामान्य शब्द,
    00:08:13
    हम देखते हैं कि छोटे हैं
    00:08:14
    स्कूल प्रारूप की चिंता,
    00:08:14
    हम संख्याओं और महीनों के साथ मिश्रित थे,
    00:08:18
    लेकिन जानकारी प्रासंगिक है,
    00:08:19
    तो हम देखेंगे कि कैसे
    00:08:21
    वेबसाइट में हेरफेर क्यों नहीं?
    00:08:23
    हम इसका फायदा उठाने में सक्षम होंगे।
    00:08:25
    पहचान संख्या,
    00:08:27
    तो यह बहुत महत्वपूर्ण है,
    00:08:28
    हम इसे भी रखेंगे।
    00:08:30
    मुख्य नगरपालिका?
    00:08:32
    वहां एक और कम्यून,
    00:08:33
    यह पहला मामला है जहां हम करेंगे।
    00:08:35
    थोड़ी और परेशानी होती है
    00:08:37
    शोषण करना क्योंकि यह पहले से ही होगा
    00:08:39
    कहने के लिए काफी जटिल हो सकता है
    00:08:40
    कि एक त्योहार पर हम चिंता करेंगे
    00:08:42
    उदाहरण के लिए कई नगर पालिकाएं
    00:08:43
    मानचित्र पर प्रदर्शित करने के लिए,
    00:08:45
    यह बहुत आसान हो जाएगा
    00:08:46
    केवल एक बात होनी चाहिए और
    00:08:48
    इसके अलावा हमारे फ्लाईओवर पर भी।
    00:08:51
    हमारा कॉलम पढ़ें,
    00:08:53
    हम देखते हैं कि यह 90% मामलों में खाली है,
    00:08:56
    तो यहां हम आम तौर पर एक मामले पर हैं जहां यह है
    00:08:59
    कॉलम रखने के लिए प्रासंगिक नहीं है,
    00:09:02
    तो हमारे पास कई तरीके होंगे,
    00:09:04
    एक कॉलम को हटाने के लिए,
    00:09:05
    पहला जो मैं आपको यहां दिखाता हूं,
    00:09:06
    यह बस इसे चुनने के लिए है,
    00:09:09
    राइट क्लिक करने के लिए जो खुलेगा
    00:09:11
    एक पूरा नियंत्रण कक्ष
    00:09:12
    जो बहुत व्यापक रूप से मेल खाती है
    00:09:13
    आपको क्या मिलेगा,
    00:09:15
    विशेष रूप से टैब में
    00:09:17
    परिवर्तन सीधे में
    00:09:19
    सत्ता में मैं और यहाँ हम जाते हैं
    00:09:22
    बस हटाने पर क्लिक करें.
    00:09:25
    हम देखते हैं कि अभी एक कदम जोड़ा गया है,
    00:09:27
    हाँ, यहाँ.
    00:09:30
    और इसलिए हम यहां जारी रखने जा रहे हैं
    00:09:34
    हमारी खोज,
    00:09:35
    तो शुरू होने की तारीख,
    00:09:37
    तो हम देखते हैं कि यह बहुत कुछ याद कर रहा है,
    00:09:39
    लेकिन यह अभी भी ठीक है
    00:09:40
    बाद के लिए उपयोगी हो,
    00:09:41
    क्योंकि विशेष रूप से बनाने के लिए
    00:09:43
    के समय में प्रतिनिधित्व,
    00:09:44
    त्योहार की मात्रा इसलिए हम इसे रखेंगे।
    00:09:47
    समाप्ति दिनांक, निर्माण दिनांक,
    00:09:49
    डाक कोड बहुत अच्छी तरह से,
    00:09:50
    पोस्टल कोड और INSEE कोड।
    00:09:52
    तो यहाँ हम अपने मामले में,
    00:09:55
    मैं आपको बताता हूं,
    00:09:55
    हम ज्यादातर काम कहां से करने जा रहे हैं?
    00:09:58
    डाक कोड की संख्या इसलिए INSEE कोड
    00:10:00
    यह काफी अलग बात है।
    00:10:03
    तो यह एक है,
    00:10:03
    यह एक और तरीका है
    00:10:05
    एक नगरपालिका नामित करें और वह
    00:10:07
    मुझे बहुत ज्यादा दिलचस्पी नहीं होगी।
    00:10:09
    तो यहां मैं इसके बजाय करूंगा
    00:10:12
    इस स्तंभ को हटा दिया जाना चाहिए
    00:10:15
    तो कोड का कोड वहां यह है।
    00:10:18
    क्योंकि यह अधिक के लिए फिट बैठता है या
    00:10:20
    मेरे लिए पोस्टल कोड की नकल से कम।
    00:10:23
    यह थोड़ा अधिक जटिल प्रारूप है।
    00:10:27
    तो, एक और विधि
    00:10:28
    स्तंभ को हटाने के लिए,
    00:10:30
    तो यहां हम इसका चयन करेंगे।
    00:10:32
    हम रिसेप्शन पर जा रहे हैं
    00:10:33
    और हम यहां देखते हैं कि हमारे पास एक आइटम है।
    00:10:35
    स्तंभों का प्रबंधन करें और वहाँ यह होगा
    00:10:37
    हमें 2 चीजें प्रदान करें
    00:10:39
    या तो स्कूल को समाप्त करने का विकल्प चुनें,
    00:10:41
    इसलिए कॉलम हटा दें।
    00:10:41
    यह बहुत सरल है,
    00:10:42
    इसने इसे हटाया नहीं
    00:10:44
    कॉलम जो मैं चुनता हूं और
    00:10:46
    इसलिए एफवाईआई मैं सब कुछ कर सकता हूं
    00:10:48
    पूंजी धारण करके किया जाता है या
    00:10:50
    मेरे कीबोर्ड पर मेरी समीक्षा पर नियंत्रण
    00:10:53
    2 कॉलम का चयन करने में सक्षम होने के लिए,
    00:10:55
    यहां वापस जाएं और क्लिक करें।
    00:10:58
    स्तंभ हटाएँ?
    00:10:59
    तो क्या होगा अगर मैं यहां ऐसा करूं?
    00:11:01
    तो जाहिर है, वापस जा सकते हैं।
    00:11:02
    यह आपको दिखाने का अवसर होगा।
    00:11:05
    हम देखते हैं, ठीक है,
    00:11:06
    उसने लेस को हटा दिया,
    00:11:09
    एक बार में 2 कॉलम।
    00:11:10
    इसलिए हम वापस जा रहे हैं।
    00:11:13
    हम अपने इनसी कोड पर वापस जाएंगे।
    00:11:17
    और हम यहाँ वापस जा रहे हैं।
    00:11:20
    जिस क्षेत्र को मैं दिखाना चाहता हूं,
    00:11:22
    तो हटाए गए कॉलम प्रबंधित करें और
    00:11:23
    अब मेरे पास एक और विकल्प है कि
    00:11:25
    अन्य स्तंभों को हटा ता है,
    00:11:27
    तो वहां इसका प्रभाव होगा
    00:11:28
    बिल्कुल उलट जो होने जा रहा है
    00:11:30
    सभी स्तंभ हटाएँ सिवाय
    00:11:31
    जिन्हें मैंने चुना।
    00:11:32
    तो वही हम लागू करेंगे लेकिन नहीं
    00:11:34
    घबराकर हम वापस जा सकते हैं।
    00:11:36
    तो आप यहाँ देखते हैं,
    00:11:38
    उन्होंने केवल मेरे कॉलम रखे।
    00:11:42
    इसलिए हम फिर से वापस जाते हैं।
    00:11:45
    और आपको नवीनतम दिखाने के लिए
    00:11:47
    इसके चारों ओर कार्यक्षमता हम
    00:11:49
    C में हमारे कोड पर वापस जाएगा
    00:11:51
    और हम इसके विपरीत होने जा रहे हैं,
    00:11:53
    यानी कॉलम चुनें,
    00:11:54
    स्तंभ चुनें,
    00:11:55
    यह सिर्फ कहने के लिए होने जा रहा है,
    00:11:57
    खैर, मैं चुनता हूं।
    00:11:59
    वह कॉलम जो मुझे यहाँ दिलचस्पी देता है,
    00:12:01
    मेरे पास एक मैदान होगा जो खुल जाएगा,
    00:12:02
    तो वहाँ, यहाँ,
    00:12:03
    मुझे बस क्षमताओं को उजागर करना है,
    00:12:07
    संभावित कॉलम जो
    00:12:08
    मुझे कोई दिलचस्पी नहीं है।
    00:12:10
    और इसलिए वह केवल मेरे पास जाएगा।
    00:12:11
    मेरे द्वारा चुने गए को रखें
    00:12:13
    और उसी तरह से।
    00:12:17
    अगर मैं एक कॉलम की तलाश में हूँ
    00:12:18
    खासकर क्योंकि मैं नहीं करता
    00:12:20
    यह सूची में नहीं मिलता है,
    00:12:21
    उदाहरण के लिए मैं यहां सक्षम हो जाऊंगा,
    00:12:22
    क्लिक करना। मेरे प्रसिद्ध इन्सी कोड के लिए।
    00:12:30
    तो मेरा पिन कोड यहाँ है
    00:12:32
    कोड यहाँ छोड़ दिया गया है,
    00:12:33
    मैं चुनता हूं और इसलिए कौन करेगा
    00:12:35
    मुझे सीधे कॉलम में ले जाएं
    00:12:37
    संभावित रूप से बाद में
    00:12:39
    हटा दें तो मैं यहां करूँगा
    00:12:41
    मेरे मेनू हॉप पर वापस जाओ मैं करूंगा
    00:12:44
    स्तंभ हटाएँ.
    00:12:47
    या नहीं, कॉलम चुनें
    00:12:48
    स्तंभ चुनें.
    00:12:52
    और वहां, हम इसे देखते हैं।
    00:12:55
    अन्य नगर पालिकाओं के कारण
    00:12:56
    कि मैंने चरण हटा दिया,
    00:12:58
    फिर से मौजूद है,
    00:13:00
    तो यहां मैं क्लिक करूंगा
    00:13:03
    हो जाएगा
    00:13:05
    INSEE कोड भी खोलें।
    00:13:07
    मैं ठीक क्लिक करता हूँ।
    00:13:09
    और इसलिए वहां हम देखते हैं कि मेरे पास एक नया आइटम है
    00:13:12
    जिसे अभी हटाया गया है।
    00:13:16
    और इसलिए हम सक्षम होंगे
    00:13:17
    अपना काम जारी रखें,
    00:13:18
    तो यहां हमारे पास कम्यून के शब्द हैं
    00:13:21
    तो यह कम्यून की शब्दावली है।
    00:13:23
    जानकारी के लिए,
    00:13:24
    हमारे पास यह पहले से ही यह था, इसलिए यह है
    00:13:26
    एक मुख्य के रूप में, बहुत नहीं
    00:13:29
    इस कॉलम को रखने के लिए प्रासंगिक
    00:13:30
    तो यहां हम इसे करने जा रहे हैं
    00:13:32
    हटाकर क्लासिक तरीका।
    00:13:36
    आगे क्या है? हम जारी रखेंगे
    00:13:41
    तो एसके विभाग की जांच करें,
    00:13:43
    यह जानकारी है
    00:13:45
    जो हमारे पास कहीं और था।
    00:13:47
    थोड़ा आगे।
    00:13:51
    यह वह विभाग है जो यहां है
    00:13:53
    इसलिए रखने की कोई जरूरत नहीं है।
    00:13:56
    वह कॉलम?
    00:13:58
    आप कहीं और देखते हैं कि यहां
    00:14:01
    हटाए गए स्तंभ नहीं हैं
    00:14:03
    यह एक ही कदम है और हम इसे देखते हैं।
    00:14:06
    यह शीट यहां वह मुझे बताएगा
    00:14:08
    तो यह एम है इसलिए यह है
    00:14:11
    मैशअप मूल रूप से कोड है जो
    00:14:12
    मेरे प्रत्येक चरण में उत्पन्न होता है
    00:14:14
    इसलिए मैं इसमें बिल्कुल फिट नहीं हूं।
    00:14:15
    इस पर अभी के लिए विवरण
    00:14:16
    हमारे पास इसके बारे में फिर से बात करने का समय होगा।
    00:14:18
    लेकिन किसी भी मामले में यह आपको अनुमति देता है,
    00:14:19
    यदि आप उस पर पहुंचते हैं,
    00:14:21
    थोड़ा जानने के लिए इसे पढ़ें
    00:14:23
    राज्य में क्या हो रहा है।
    00:14:25
    तो यहाँ,
    00:14:26
    मैंने विभाग और K को हटा दिया और
    00:14:30
    फिर हमारे पास प्रतिभागियों की हमारी मात्रा है।
    00:14:33
    2018 2017 इसलिए हम बहुत अच्छे हैं,
    00:14:34
    हम एक और पास बनाने जा रहे हैं।
    00:14:35
    घटना का नाम
    00:14:36
    कोई समस्या नहीं है,
    00:14:37
    डोमेन पूरी तरह से क्षेत्र,
    00:14:38
    डोमेन विभाग आवधिकता,
    00:14:40
    महीने शुरू करो, वेबसाइट,
    00:14:43
    पहचान संख्या,
    00:14:44
    नगरपालिका, संस्करण की संख्या,
    00:14:46
    समाप्ति तिथि की प्रारंभ तिथि,
    00:14:48
    सृजन की तारीख,
    00:14:49
    डाक कोड, INSEE कोड,
    00:14:51
    विभाग का नाम और 2
    00:14:54
    2018 के लिए प्रतिभागी वॉल्यूम।
    00:14:56
    2017 में, इसलिए,
    00:14:57
    वहाँ से
    00:14:58
    हम विचार कर सकते हैं कि हमने हटा दिया है
    00:15:00
    सभी स्तंभ जो नहीं थे
    00:15:01
    हमारी परियोजना के लिए आवश्यक नहीं है।

    Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
    Effectuez une autre recherche ou retournez au contenu !

     

    00:00:02
    Quindi, ora che abbiamo
    00:00:03
    salva il nostro file,
    00:00:04
    Saremo in grado di iniziare a realizzare
    00:00:06
    il nostro primo ritrattamento,
    00:00:07
    Quindi, una volta che siamo qui,
    00:00:08
    Andremo a trasformare i dati.
    00:00:11
    Trasforma i dati che vanno
    00:00:13
    permetterci di visualizzare Power Quéry
    00:00:15
    e il primo elemento interessante,
    00:00:17
    Vediamo che ci sono già stati passi avanti
    00:00:18
    di ritrattamento mentre abbiamo
    00:00:20
    niente ha chiesto un ricordare,
    00:00:21
    Abbiamo appena fatto un carico di
    00:00:23
    ed è per questo che l'abbiamo fatto.
    00:00:24
    Era per mostrarti con precisione
    00:00:26
    Il tipo di intelligenza che
    00:00:28
    può essere proverbiale,
    00:00:29
    Quindi fondamentalmente quello che abbiamo chiesto,
    00:00:31
    È questo primo passo che è qui,
    00:00:32
    che è la fonte dei dati eh.
    00:00:34
    Quindi, come promemoria,
    00:00:35
    se clicco qui sul Pedro sdentato,
    00:00:38
    Avremo il percorso
    00:00:39
    al file se sei ingannato,
    00:00:41
    Bene, puoi cliccare qui
    00:00:42
    sulla navigazione. Per farlo di nuovo?
    00:00:46
    E poi andremo alla navigazione,
    00:00:48
    Quindi è normale, eh,
    00:00:49
    Questo è quando abbiamo selezionato il
    00:00:51
    uno per essere in grado di lavorare e da
    00:00:53
    Contro ciò che è interessante è
    00:00:54
    che ha rilevato automaticamente il
    00:00:56
    il fatto che la tabella includesse
    00:00:58
    Quindi è abbastanza buono.
    00:01:00
    Ciò è legato al fatto che il
    00:01:02
    in Excel era molto ben preparato
    00:01:04
    nel senso che è stato dichiarato in
    00:01:07
    come una tabella in Excel in modo che questo
    00:01:10
    che spiega dopo questo certo
    00:01:12
    intelligenza eh da Excel
    00:01:13
    è anche Microsoft e vediamo
    00:01:15
    Un altro elemento è questo.
    00:01:17
    È cambiato.
    00:01:18
    E i tipi di alcuni,
    00:01:21
    alcune colonne,
    00:01:21
    Quindi lì d'altra parte,
    00:01:23
    Ci vorrà anche un po 'di tempo
    00:01:24
    diffidate di esso,
    00:01:25
    Cosa può dedurre da certe cose
    00:01:26
    che per una volta non ci sono
    00:01:29
    necessariamente vero quindi comporterà
    00:01:30
    comunque per controllare il tipo eh.
    00:01:32
    Come promemoria,
    00:01:33
    Il tipo è qui su ogni colonna
    00:01:36
    essere in grado di modificare il tipo del del,
    00:01:38
    della colonna e questo è interessante
    00:01:40
    appunto per poter fare
    00:01:42
    somme su ad esempio numeri,
    00:01:44
    numeri di potenza,
    00:01:46
    Calcola le durate tra 2 date.
    00:01:48
    Quindi qui avremo bisogno di date.
    00:01:50
    Essere in grado di fare concatenazioni di
    00:01:52
    estrazioni tramite una colonna di testo,
    00:01:54
    eccetera, eccetera.
    00:01:56
    Quindi è un passo piuttosto importante.
    00:01:58
    quindi qui diremo che Potenza
    00:02:01
    Mail ha fatto il suo lavoro piuttosto bene
    00:02:03
    e saremo in grado di iniziare un po '
    00:02:06
    Poco per continuare le modifiche.
    00:02:08
    Quindi il primo passo che ho
    00:02:10
    ti consiglia lì nel momento in cui hai
    00:02:12
    ha portato il tuo primo set di dati,
    00:02:14
    è quello di ordinare tra le colonne
    00:02:16
    che hai recuperato quando abbiamo
    00:02:19
    ha eseguito la ricerca per indicizzazione del file in Excel,
    00:02:20
    Abbiamo visto che potenzialmente avevamo
    00:02:22
    Duplicati.
    00:02:22
    Cose che non erano necessariamente
    00:02:24
    interessante di di tenere in
    00:02:26
    nel file e così faremo
    00:02:28
    Cerca di capire un po 'in quale
    00:02:30
    Nel caso in cui le colonne debbano essere eliminate.
    00:02:34
    Allora
    00:02:35
    Immaginiamo che stiamo lavorando su
    00:02:37
    dei dati di vendita effettuati
    00:02:39
    da uno, da un'azienda.
    00:02:41
    Quindi quali sono i grandi passi della figura
    00:02:43
    in cui possiamo dire che abbiamo
    00:02:44
    il diritto di abolire definitivamente il diritto,
    00:02:46
    La possibilità di eliminare una colonna?
    00:02:48
    Il primo è che i dati
    00:02:51
    non sono necessari per il progetto.
    00:02:53
    Eccoci su uno contro uno,
    00:02:57
    su un riepilogo delle vendite che
    00:02:59
    sono stati effettuati da una società,
    00:03:01
    per avere, ad esempio, il numero
    00:03:03
    dei telefoni dei clienti.
    00:03:04
    In uno strumento di visualizzazione,
    00:03:06
    Non mi farà molto bene.
    00:03:09
    Allora perché mantenere questa colonna
    00:03:11
    lì che inquinerà la mia pittura,
    00:03:13
    che potenzialmente aumenteranno
    00:03:15
    anche il mio file,
    00:03:17
    quindi c'è potenzialmente se è
    00:03:18
    inutile per quello che sto cercando di fare,
    00:03:21
    Bene, posso eliminare la colonna.
    00:03:24
    Nota che se non lo sei ancora
    00:03:26
    certo che la colonna ti sia utile,
    00:03:29
    puoi lasciarlo e
    00:03:31
    più tardi cancellalo, eh,
    00:03:32
    È abbastanza possibile fare
    00:03:34
    cancellazioni leggermente incrementali,
    00:03:36
    un po 'più tardi nel ritrattamento.
    00:03:39
    Un altro elemento,
    00:03:40
    sono duplicati,
    00:03:41
    Quindi capita molto spesso a
    00:03:43
    A cosa ci colleghiamo spesso
    00:03:44
    fonti tecniche,
    00:03:46
    Quindi è il fatto che 2
    00:03:49
    le colonne salgono notevolmente,
    00:03:50
    o esattamente le stesse informazioni,
    00:03:52
    o quasi.
    00:03:53
    Quindi, dopo la questione del formato, il
    00:03:55
    stesse informazioni quindi ad esempio
    00:03:56
    qui nel caso do questi 2
    00:03:59
    colonne indicanti il mese della vendita,
    00:04:00
    ce n'è uno che è in formato scritto,
    00:04:02
    Quindi sarebbe scritto allegato e l'altro formato.
    00:04:04
    No, sarà scritto 6, quindi in genere c'è
    00:04:06
    Non è utile mantenere il 2
    00:04:08
    eh sono le stesse informazioni.
    00:04:10
    Quindi ecco il più logico,
    00:04:11
    è semplicemente per mantenere il
    00:04:13
    formato che ci si addice meglio,
    00:04:14
    quindi potenzialmente la figura,
    00:04:16
    perché tenderei a
    00:04:20
    Esegui per e quindi elimina
    00:04:22
    Colonna di test del testo.
    00:04:24
    Dare un
    00:04:26
    Quindi qui ci troviamo in un
    00:04:29
    o nel 95% dei casi,
    00:04:31
    I dati non sono disponibili quindi
    00:04:33
    È davvero rilevante
    00:04:35
    per mantenere una colonna dove c'è anche
    00:04:38
    Più di pochi dati presenti
    00:04:40
    e così lì nel caso che do
    00:04:43
    Codifica il codice Immaginiamo un codice a barre?
    00:04:45
    L'identificatore viene compilato molto raramente
    00:04:49
    Quindi e cosa sarò davvero in grado di fare
    00:04:52
    sfruttare i dati sul 5% delle linee.
    00:04:54
    Forse no
    00:04:55
    e quindi nel qual caso è più
    00:04:57
    Saggio eliminare la colonna.
    00:04:59
    E l'ultimo elemento,
    00:05:01
    sono dati di scarsa qualità,
    00:05:03
    Quindi supponiamo che tu abbia un
    00:05:05
    con etichetta Codice
    00:05:06
    postale e che di volta in volta,
    00:05:07
    Troverete piuttosto
    00:05:09
    il nome del negozio,
    00:05:11
    Quindi, di tanto in tanto,
    00:05:12
    Immaginiamo anche nella metà dei casi,
    00:05:14
    o anche troppo,
    00:05:14
    il nome del negozio in modo che dimostri
    00:05:16
    un po 'di problema che
    00:05:18
    potrebbe aver avuto intorno a questa colonna
    00:05:20
    lì e quindi potenzialmente anche il
    00:05:22
    codici postali presenti,
    00:05:23
    che normalmente sarebbe il formato giusto,
    00:05:25
    sono potenzialmente falsi e quindi
    00:05:27
    Fai attenzione che può essere pericoloso.
    00:05:29
    Ancora una volta
    00:05:31
    Non è necessario eliminare il
    00:05:33
    le colonne quando hai un dubbio,
    00:05:36
    Puoi farlo un po 'più tardi.
    00:05:37
    Ma nel complesso, quando si dispone di un
    00:05:39
    un po' la risposta in mente,
    00:05:41
    Bene, puoi direttamente
    00:05:43
    Eliminare la colonna.
    00:05:45
    Quindi, per questo, ci gireremo intorno,
    00:05:47
    andremo a Power Quéry.
    00:05:53
    Ecco, ecco, ci divertiremo altrove
    00:05:56
    Per rinominare il nostro set di dati
    00:05:58
    che chiameremo qui festival. Ecco.
    00:06:05
    E saremo in grado di fare un po '
    00:06:07
    guarda il nostro set di dati,
    00:06:09
    quindi il nome dell'evento
    00:06:12
    Non ho problemi con questo.
    00:06:14
    Né lo fa la regione,
    00:06:16
    Dominio del componente aggiuntivo del dominio.
    00:06:19
    Non sembra molto pieno, quindi
    00:06:21
    Come so cosa è molto
    00:06:23
    riempito o non riempito molto,
    00:06:25
    Quindi hai questa barra secondaria qui
    00:06:26
    che ti darà un certo numero
    00:06:29
    Informazioni molto interessanti.
    00:06:30
    Quindi il fatto che avremo da
    00:06:34
    esempio qui 67% del completamento del
    00:06:37
    della colonna quindi nel 67% dei casi,
    00:06:40
    La riga ha un valore.
    00:06:42
    Egli ci darà anche
    00:06:44
    un indicatore di errore,
    00:06:46
    quindi potenzialmente linee
    00:06:47
    che contengono errori.
    00:06:48
    Vedremo i tipi di errori
    00:06:50
    che sono possibili.
    00:06:51
    E poi il numero di colonne vuote.
    00:06:54
    E che, improvvisamente, Tu vedi qui allora,
    00:06:55
    quando è verde,
    00:06:56
    Bene, questo è il,
    00:06:58
    l'indicatore di completamento all'ingrosso di
    00:07:00
    della colonna e non dà
    00:07:03
    Già qui opzioni per eliminare
    00:07:04
    ad esempio, elementi vuoti,
    00:07:06
    quindi vale a dire le linee che sono,
    00:07:08
    che sono quindi ovviamente lì,
    00:07:09
    Ci siamo
    00:07:10
    Non lo faremo perché abbiamo
    00:07:12
    2/3 di colonne riempite in modo che
    00:07:14
    può essere abbastanza rilevante in
    00:07:15
    termini di in termini di sfruttamento.
    00:07:17
    Un altro punto è importante,
    00:07:19
    Vediamo che le colonne che
    00:07:21
    sono inizialmente vuoti nel.
    00:07:23
    Nel file sono stati qui
    00:07:25
    completato dal valore zero,
    00:07:27
    Quindi questo è molto importante e tu non lo fai
    00:07:30
    Non trovare mai un valore veramente vuoto.
    00:07:32
    Infatti
    00:07:33
    Dal momento che la potenza delle query
    00:07:34
    automaticamente ed essere in grado di fare bene,
    00:07:35
    Lo sostituirà con zero.
    00:07:37
    Non dovrebbe essere compreso da un testo reale,
    00:07:40
    una vera e propria formulazione,
    00:07:41
    è solo una visione,
    00:07:44
    un modo per visualizzare il valore,
    00:07:46
    Il fatto che il valore sia vuoto.
    00:07:48
    Ma come vedi,
    00:07:49
    è in corsivo e quindi
    00:07:50
    non ha alcun valore reale.
    00:07:52
    D'altra parte, possiamo fare di tutto per
    00:07:53
    fa dire per esempio.
    00:07:54
    Elimino tutti i valori null
    00:07:56
    di una colonna e così lì all'improvviso ci dà
    00:07:59
    aiuta molto avere una denominazione
    00:08:00
    per questo per l'assenza di valore.
    00:08:04
    Poi avremo il dipartimento.
    00:08:08
    Il periodo della città,
    00:08:09
    Quindi sì, qui,
    00:08:09
    Non è particolarmente un problema.
    00:08:11
    La solita parola all'inizio,
    00:08:13
    Vediamo che ci sono piccoli
    00:08:14
    problemi di formato scolastico,
    00:08:14
    eravamo mescolati con numeri e mesi,
    00:08:18
    ma l'informazione è rilevante,
    00:08:19
    Quindi vedremo come il
    00:08:21
    Manipolare il sito web perché no?
    00:08:23
    Saremo in grado di sfruttarlo.
    00:08:25
    Il numero di identificazione,
    00:08:27
    Quindi questo è abbastanza importante,
    00:08:28
    Lo terremo anche noi.
    00:08:30
    Il comune principale?
    00:08:32
    Un altro comune lì,
    00:08:33
    Questo è il primo caso in cui
    00:08:35
    avere un po 'più di problemi
    00:08:37
    da sfruttare perché già lo farà
    00:08:39
    essere abbastanza complicato da dire
    00:08:40
    che su un festival ci preoccuperemo
    00:08:42
    Diversi comuni per esempio
    00:08:43
    da visualizzare su una mappa,
    00:08:45
    sarà molto più semplice
    00:08:46
    avere un solo punto e
    00:08:48
    Oltre a quello al cavalcavia sul nostro.
    00:08:51
    Leggi la nostra rubrica,
    00:08:53
    Vediamo che è vuoto nel 90% dei casi,
    00:08:56
    Quindi qui siamo in genere su un caso in cui
    00:08:59
    non è rilevante mantenere la colonna,
    00:09:02
    Quindi avremo diversi metodi,
    00:09:04
    eh per eliminare una colonna,
    00:09:05
    il primo che vi mostro qui,
    00:09:06
    è semplicemente per selezionarlo,
    00:09:09
    per fare un clic destro che si aprirà
    00:09:11
    Un intero pannello di controllo
    00:09:12
    che corrisponde molto ampiamente
    00:09:13
    cosa troverai,
    00:09:15
    soprattutto nella scheda di
    00:09:17
    Trasformazione direttamente in in
    00:09:19
    il potere io ed eccoci qui
    00:09:22
    Basta fare clic su Elimina.
    00:09:25
    Vediamo che è stato appena aggiunto un passaggio,
    00:09:27
    eh, qui.
    00:09:30
    E quindi continueremo qui
    00:09:34
    la nostra esplorazione,
    00:09:35
    quindi la data di inizio,
    00:09:37
    Quindi vediamo che manca molto,
    00:09:39
    ma va ancora bene
    00:09:40
    essere utile per dopo,
    00:09:41
    Perché in particolare per fare
    00:09:43
    rappresentazioni al tempo di,
    00:09:44
    del volume del festival quindi lo terremo.
    00:09:47
    La data di fine, la data di creazione,
    00:09:49
    il codice postale molto bene,
    00:09:50
    Codice postale e codice INSEE.
    00:09:52
    Quindi eccoci qui nel nostro caso,
    00:09:55
    Io vi dico,
    00:09:55
    Per lo più lavoreremo da
    00:09:58
    del codice postale quindi il codice INSEE
    00:10:00
    E' qualcosa di molto diverso.
    00:10:03
    Quindi è un,
    00:10:03
    Questo è un altro modo di
    00:10:05
    designare un comune e che
    00:10:07
    non mi interesserà troppo.
    00:10:09
    Quindi qui tenderò piuttosto a
    00:10:12
    da eliminare questa colonna
    00:10:15
    Quindi c'è del codice del codice che è.
    00:10:18
    Perché si adatta a più o
    00:10:20
    meno per me a un duplicato del codice postale.
    00:10:23
    È solo un formato leggermente più complicato.
    00:10:27
    Quindi, un altro metodo
    00:10:28
    per eliminare una colonna,
    00:10:30
    Quindi qui lo selezioneremo.
    00:10:32
    Andremo alla reception
    00:10:33
    E vediamo qui che abbiamo un oggetto.
    00:10:35
    Gestisci le colonne e lì lo farà
    00:10:37
    Offrici 2 cose così 2
    00:10:39
    scegliere di abolire la scuola,
    00:10:41
    Quindi elimina le colonne.
    00:10:41
    Bah è piuttosto semplice eh,
    00:10:42
    Non ha rimosso il
    00:10:44
    colonne che seleziono e
    00:10:46
    quindi FYI posso fare tutto
    00:10:48
    effettuata detenendo capitale o
    00:10:50
    Controllo sulla mia recensione sulla mia tastiera
    00:10:53
    per poter selezionare 2 colonne,
    00:10:55
    Torna qui e clicca.
    00:10:58
    Eliminare le colonne?
    00:10:59
    E se lo facessi qui?
    00:11:01
    Quindi, ovviamente, può tornare indietro.
    00:11:02
    Questa sarà l'occasione per mostrarvelo.
    00:11:05
    Vediamo che, Bene,
    00:11:06
    ha cancellato il LES,
    00:11:09
    le 2 colonne contemporaneamente.
    00:11:10
    Quindi torneremo indietro.
    00:11:13
    Torneremo al nostro codice insee.
    00:11:17
    E torneremo qui.
    00:11:20
    Il campo che voglio mostrare,
    00:11:22
    quindi gestire le colonne cancellate e
    00:11:23
    Ora ho un'altra opzione che
    00:11:25
    è eliminare le altre colonne,
    00:11:27
    Quindi lì avrà l'effetto
    00:11:28
    esattamente invertito che sarà
    00:11:30
    eliminare tutte le colonne tranne
    00:11:31
    quelli che ho selezionato.
    00:11:32
    Quindi lo stesso applicheremo ma non
    00:11:34
    Panico possiamo tornare indietro.
    00:11:36
    Quindi vedete qui,
    00:11:38
    Ha tenuto solo le mie colonne.
    00:11:42
    Quindi torniamo di nuovo.
    00:11:45
    E per mostrarti le ultime novità
    00:11:47
    funzionalità intorno a ciò che abbiamo
    00:11:49
    tornerà al nostro codice in C
    00:11:51
    e avremo il rovescio nudo,
    00:11:53
    cioè scegliere le colonne,
    00:11:54
    scegli le colonne,
    00:11:55
    Sarà solo per dire,
    00:11:57
    Bene, scelgo.
    00:11:59
    La rubrica che mi interessa qui,
    00:12:01
    Avrò un campo che si aprirà,
    00:12:02
    Quindi lì, qui,
    00:12:03
    Non mi resta che sbloccare le potenzialità,
    00:12:07
    le potenziali colonne che
    00:12:08
    Non mi interessa.
    00:12:10
    E così andrà solo da me.
    00:12:11
    mantieni quello che ho selezionato
    00:12:13
    e allo stesso modo.
    00:12:17
    Se sto cercando una colonna
    00:12:18
    Soprattutto perché non lo faccio
    00:12:20
    non lo trova nell'elenco,
    00:12:21
    Sarò in grado qui per esempio,
    00:12:22
    Clic. Al mio famoso codice insee.
    00:12:30
    Quindi il mio codice pin è qui
    00:12:32
    il codice è lasciato qui,
    00:12:33
    Seleziono e quindi chi lo farà
    00:12:35
    Portami direttamente alla colonna
    00:12:37
    per dopo potenzialmente il
    00:12:39
    cancellare così qui lo farò
    00:12:41
    Torna al mio menu hop Lo farò
    00:12:44
    Eliminare le colonne.
    00:12:47
    Oppure no, scegli le colonne
    00:12:48
    Scegli le colonne.
    00:12:52
    E lì, lo vediamo.
    00:12:55
    Gli altri comuni perché
    00:12:56
    che ho eliminato il passaggio,
    00:12:58
    è di nuovo presente,
    00:13:00
    Quindi qui cliccherò su
    00:13:03
    Va bene
    00:13:05
    Annulla anche il codice INSEE.
    00:13:07
    Faccio clic su OK.
    00:13:09
    E così vediamo che ho un nuovo oggetto
    00:13:12
    che è stato appena rimosso.
    00:13:16
    E così saremo in grado di
    00:13:17
    continuare il nostro lavoro,
    00:13:18
    Quindi qui abbiamo la formulazione del comune
    00:13:21
    Questa è la formulazione del comune.
    00:13:23
    Per informazioni,
    00:13:24
    L'abbiamo già avuto qui, quindi è
    00:13:26
    come principale quindi non molto
    00:13:29
    rilevante per mantenere questa colonna
    00:13:30
    Quindi qui lo faremo da
    00:13:32
    modo classico eliminando.
    00:13:36
    Qual è il prossimo passo? Continueremo a
    00:13:41
    quindi controlla il dipartimento SK,
    00:13:43
    è informazione
    00:13:45
    che abbiamo avuto altrove.
    00:13:47
    Un po' più in là.
    00:13:51
    Questo è il dipartimento che è qui
    00:13:53
    quindi non c'è bisogno di tenere.
    00:13:56
    Quella colonna?
    00:13:58
    Ne vedi uno altrove che qui
    00:14:01
    Le colonne eliminate non sono
    00:14:03
    che un singolo passo e lo vediamo in
    00:14:06
    Questo foglio qui mi dirà
    00:14:08
    quindi questa è la M quindi è la
    00:14:11
    mashup è fondamentalmente il codice che
    00:14:12
    viene generato in ogni mio passaggio
    00:14:14
    quindi non ci rientro affatto
    00:14:15
    I dettagli per ora su questo
    00:14:16
    Avremo tempo per parlarne ancora
    00:14:18
    ma in ogni caso ti permette,
    00:14:19
    Se arrivate all'at,
    00:14:21
    Leggilo per saperne un po'
    00:14:23
    Cosa sta succedendo nello stato.
    00:14:25
    Quindi qui,
    00:14:26
    Ho eliminato il dipartimento e K e
    00:14:30
    Poi abbiamo il nostro volume di partecipanti.
    00:14:33
    2018 2017 quindi eccoci abbastanza bene,
    00:14:34
    Faremo un altro passaggio.
    00:14:35
    Il nome dell'evento
    00:14:36
    non ha problemi,
    00:14:37
    la regione il dominio completamente,
    00:14:38
    periodicità del dipartimento di dominio,
    00:14:40
    mese di inizio, il sito web,
    00:14:43
    il numero di identificazione,
    00:14:44
    il comune, il numero dell'edizione,
    00:14:46
    la data di inizio della data di fine,
    00:14:48
    la data di creazione,
    00:14:49
    il codice postale, il codice INSEE,
    00:14:51
    il nome del dipartimento e il 2
    00:14:54
    Volumi di partecipanti per il 2018.
    00:14:56
    Nel 2017, quindi,
    00:14:57
    quindi
    00:14:58
    Possiamo considerare che abbiamo cancellato
    00:15:00
    Tutte le colonne che non lo erano
    00:15:01
    non necessario per il nostro progetto.

    Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
    Effectuez une autre recherche ou retournez au contenu !

     

    00:00:02
    Jadi, sekarang kita
    00:00:03
    menyimpan file kami,
    00:00:04
    Kita akan dapat mulai menyadari
    00:00:06
    pemrosesan ulang pertama kami,
    00:00:07
    Jadi untuk itu, begitu kita di sini,
    00:00:08
    Kita akan pergi ke mengubah data.
    00:00:11
    Mengubah data yang berjalan
    00:00:13
    izinkan kami untuk menampilkan Power Quéry
    00:00:15
    dan elemen menarik pertama,
    00:00:17
    Kami melihat bahwa sudah ada langkah-langkah
    00:00:18
    pemrosesan ulang sementara kami memiliki
    00:00:20
    tidak ada yang bertanya ingat,
    00:00:21
    Kami baru saja melakukan banyak
    00:00:23
    data dan itulah mengapa kami melakukannya.
    00:00:24
    Itu untuk menunjukkan kepada Anda dengan tepat
    00:00:26
    Jenis kecerdasan yang
    00:00:28
    mungkin dalam pepatah,
    00:00:29
    Jadi pada dasarnya kami apa yang kami minta,
    00:00:31
    Langkah pertama inilah yang ada di sini,
    00:00:32
    yang mana sumber datanya ya.
    00:00:34
    Jadi sebagai pengingat,
    00:00:35
    jika saya klik di sini pada Pedro ompong,
    00:00:38
    Kita akan memiliki jalannya
    00:00:39
    ke file jika Anda tertipu,
    00:00:41
    Nah anda bisa klik disini
    00:00:42
    saat menjelajah. Untuk melakukannya lagi?
    00:00:46
    Dan kemudian kita akan pergi ke navigasi,
    00:00:48
    Jadi itu normal, ya,
    00:00:49
    Ini adalah saat kami memilih
    00:00:51
    satu untuk dapat bekerja dan oleh
    00:00:53
    Melawan apa yang menarik adalah
    00:00:54
    bahwa itu secara otomatis mendeteksi
    00:00:56
    fakta bahwa tabel termasuk
    00:00:58
    Jadi itu cukup bagus.
    00:01:00
    Ini terkait dengan fakta bahwa
    00:01:02
    di Excel sangat dipersiapkan dengan baik
    00:01:04
    dalam arti dinyatakan dalam
    00:01:07
    sebagai tabel di Excel jadi ini
    00:01:10
    yang menjelaskan setelah ini pasti
    00:01:12
    kecerdasan eh sejak Excel
    00:01:13
    itu juga Microsoft dan kita lihat
    00:01:15
    Elemen lain adalah itu.
    00:01:17
    Dia berubah.
    00:01:18
    Dan jenis-jenis beberapa,
    00:01:21
    kolom tertentu,
    00:01:21
    Jadi di sisi lain,
    00:01:23
    Ini juga akan memakan waktu sedikit
    00:01:24
    sedikit waspada terhadapnya,
    00:01:25
    apa yang bisa dia simpulkan dari hal-hal tertentu
    00:01:26
    yang ada untuk sekali tidak
    00:01:29
    tentu benar sehingga akan melibatkan
    00:01:30
    pokoknya untuk cek jenisnya ya.
    00:01:32
    Sebagai pengingat,
    00:01:33
    Jenisnya ada di sini di setiap kolom
    00:01:36
    untuk dapat mengubah jenis dari,
    00:01:38
    dari kolom dan itu menarik
    00:01:40
    tepatnya untuk bisa membuat
    00:01:42
    jumlah pada misalnya angka,
    00:01:44
    nomor daya,
    00:01:46
    Hitung durasi antara 2 tanggal.
    00:01:48
    Jadi di sini kita akan membutuhkan tanggal.
    00:01:50
    Untuk dapat melakukan penggabungan
    00:01:52
    ekstraksi melalui kolom teks,
    00:01:54
    et cetera, et cetera.
    00:01:56
    Jadi ini langkah yang cukup penting.
    00:01:58
    jadi di sini kita akan mengatakan bahwa Kekuatan
    00:02:01
    Mail telah melakukan tugasnya dengan cukup baik
    00:02:03
    dan kita akan dapat memulai sedikit
    00:02:06
    Sedikit untuk melanjutkan modifikasi.
    00:02:08
    Jadi langkah pertama yang saya
    00:02:10
    menyarankan Anda di sana pada saat Anda memiliki
    00:02:12
    membawa himpunan data pertama Anda,
    00:02:14
    adalah mengurutkan kolom
    00:02:16
    bahwa Anda pulih ketika kami
    00:02:19
    telah merayapi file di Excel,
    00:02:20
    Kami melihat bahwa kami berpotensi memiliki
    00:02:22
    Duplikat.
    00:02:22
    Hal-hal yang belum tentu
    00:02:24
    menarik dari untuk disimpan
    00:02:26
    yang ada di dalam file dan kami akan melakukannya
    00:02:28
    cobalah untuk memahami sedikit di mana
    00:02:30
    Jika kolom harus dihapus.
    00:02:34
    Kemudian
    00:02:35
    Mari kita bayangkan bahwa kita sedang mengerjakan
    00:02:37
    dari data penjualan yang dilakukan
    00:02:39
    oleh satu, oleh sebuah perusahaan.
    00:02:41
    Lantas apa saja langkah besar tokoh
    00:02:43
    di mana kita dapat mengatakan bahwa kita memiliki
    00:02:44
    hak untuk akhirnya menghapuskan hak,
    00:02:46
    Kemampuan untuk menghapus kolom?
    00:02:48
    Yang pertama adalah bahwa data
    00:02:51
    tidak perlu untuk proyek.
    00:02:53
    Di sini kita berada di satu lawan satu,
    00:02:57
    pada ringkasan penjualan yang
    00:02:59
    dilakukan oleh sebuah perusahaan,
    00:03:01
    untuk memiliki, misalnya, nomor
    00:03:03
    ponsel pelanggan.
    00:03:04
    Dalam alat visualisasi,
    00:03:06
    Itu tidak akan banyak membantu saya.
    00:03:09
    Jadi mengapa menyimpan kolom ini
    00:03:11
    di sana yang akan mencemari lukisan saya,
    00:03:13
    yang berpotensi meningkat
    00:03:15
    juga file saya,
    00:03:17
    jadi ada potensi jika memang
    00:03:18
    tidak berguna untuk apa yang saya coba lakukan,
    00:03:21
    Nah saya bisa menghapus kolom.
    00:03:24
    Perhatikan bahwa jika Anda belum
    00:03:26
    yakin bahwa kolom itu berguna bagi Anda,
    00:03:29
    Anda dapat meninggalkannya dan
    00:03:31
    nanti hapus, ya,
    00:03:32
    Sangat mungkin untuk membuat
    00:03:34
    penghapusan sedikit bertahap,
    00:03:36
    beberapa saat kemudian dalam pemrosesan ulang.
    00:03:39
    Elemen lain,
    00:03:40
    itu duplikat,
    00:03:41
    Jadi itu sangat sering terjadi pada
    00:03:43
    Apa yang sering kita hubungkan
    00:03:44
    sumber teknis,
    00:03:46
    Jadi faktanya 2
    00:03:49
    kolom naik secara nyata,
    00:03:50
    baik informasi yang persis sama,
    00:03:52
    atau hampir.
    00:03:53
    Jadi setelah pertanyaan format
    00:03:55
    informasi yang sama jadi misalnya
    00:03:56
    di sini dalam kasus ini saya memberikan 2 ini
    00:03:59
    kolom yang memberikan bulan penjualan,
    00:04:00
    ada yang dalam format tertulis,
    00:04:02
    Jadi akan ditulis terlampir dan format lainnya.
    00:04:04
    Tidak, itu akan ditulis 6 jadi biasanya ada
    00:04:06
    Tidak berguna untuk menyimpan 2
    00:04:08
    ya itu informasi yang sama.
    00:04:10
    Jadi di sini yang paling logis,
    00:04:11
    itu hanya untuk menjaga
    00:04:13
    format yang paling cocok untuk kita,
    00:04:14
    jadi berpotensi angkanya,
    00:04:16
    karena saya akan cenderung
    00:04:20
    lakukan untuk lalu hapus
    00:04:22
    Kolom uji teks.
    00:04:24
    Berikan yang konsisten,
    00:04:26
    Jadi di sini kita menemukan diri kita dalam
    00:04:29
    kolom atau dalam 95% kasus,
    00:04:31
    Data tidak tersedia sehingga
    00:04:33
    Apakah ini benar-benar relevan
    00:04:35
    untuk menyimpan kolom di mana ada juga
    00:04:38
    Lebih dari sedikit data yang ada
    00:04:40
    dan di sana dalam kasus yang saya berikan
    00:04:43
    kode kode mari kita bayangkan barcode?
    00:04:45
    Pengidentifikasi sangat jarang diisi
    00:04:49
    Jadi dan apa yang benar-benar akan saya bisa
    00:04:52
    mengeksploitasi data pada 5% dari garis.
    00:04:54
    Mungkin tidak
    00:04:55
    dan karena itu dalam hal ini lebih
    00:04:57
    Bijaksana untuk menghapus kolom.
    00:04:59
    Dan elemen terakhir,
    00:05:01
    itu adalah data berkualitas buruk,
    00:05:03
    Jadi katakanlah Anda memiliki
    00:05:05
    kolom yang diberi label Kode
    00:05:06
    pos dan itu dari waktu ke waktu,
    00:05:07
    Anda akan menemukan lebih tepatnya
    00:05:09
    nama toko,
    00:05:11
    Jadi dari waktu ke waktu,
    00:05:12
    Mari kita bayangkan dalam setengah dari kasus,
    00:05:14
    atau bahkan terlalu banyak,
    00:05:14
    nama toko jadi terbukti
    00:05:16
    sedikit masalah yang
    00:05:18
    mungkin ada di sekitar kolom ini
    00:05:20
    di sana dan karena itu berpotensi bahkan
    00:05:22
    kode pos yang ada,
    00:05:23
    yang biasanya akan menjadi format yang tepat,
    00:05:25
    berpotensi salah dan oleh karena itu
    00:05:27
    Hati-hati itu bisa berbahaya.
    00:05:29
    Sekali lagi
    00:05:31
    Anda tidak perlu menghapus
    00:05:33
    kolom ketika Anda memiliki keraguan,
    00:05:36
    Anda dapat melakukannya nanti.
    00:05:37
    Tetapi secara keseluruhan, ketika Anda memiliki
    00:05:39
    sedikit jawabannya dalam pikiran,
    00:05:41
    Nah, Anda bisa langsung
    00:05:43
    Menghapus kolom.
    00:05:45
    Jadi untuk itu, kita akan berbalik,
    00:05:47
    kita akan pergi ke Power Quéry.
    00:05:53
    Di sini, itu saja, kita akan menikmatinya di tempat lain
    00:05:56
    untuk mengganti nama himpunan data kami
    00:05:58
    yang akan kita sebut di sini festival. Dan itu dia.
    00:06:05
    Dan kita akan dapat melakukan sedikit
    00:06:07
    lihat himpunan data kami,
    00:06:09
    jadi nama acaranya
    00:06:12
    Saya tidak punya masalah dengan itu.
    00:06:14
    Begitu juga dengan wilayahnya,
    00:06:16
    Domain add-in domain.
    00:06:19
    Itu tidak terlihat sangat penuh jadi
    00:06:21
    Bagaimana saya tahu apa yang banyak
    00:06:23
    diisi atau tidak diisi banyak,
    00:06:25
    Jadi, Anda memiliki sub-bar ini di sini
    00:06:26
    yang akan memberi Anda nomor tertentu
    00:06:29
    informasi yang sangat menarik.
    00:06:30
    Jadi fakta bahwa kita akan memiliki oleh
    00:06:34
    contoh di sini 67% dari Penyelesaian
    00:06:37
    dari kolom jadi dalam 67% kasus,
    00:06:40
    Baris memiliki nilai.
    00:06:42
    Dia juga akan memberi kita
    00:06:44
    indikator kesalahan,
    00:06:46
    jadi garis yang berpotensi
    00:06:47
    yang mengandung kesalahan.
    00:06:48
    Kami akan melihat jenis kesalahan
    00:06:50
    itu mungkin.
    00:06:51
    Dan kemudian jumlah kolom kosong.
    00:06:54
    Dan itu, tiba-tiba, Anda lihat di sini kemudian,
    00:06:55
    ketika berwarna hijau,
    00:06:56
    Nah itulah,
    00:06:58
    ukuran penyelesaian grosir dari
    00:07:00
    kolom dan tidak memberi
    00:07:03
    Sudah di sini opsi untuk menghapus
    00:07:04
    misalnya, elemen kosong,
    00:07:06
    jadi yaitu garis-garis yang,
    00:07:08
    yang oleh karena itu jelas ada di sana,
    00:07:09
    Kita mulai,
    00:07:10
    Kami tidak akan melakukannya karena kami memiliki
    00:07:12
    2/3 kolom diisi sehingga
    00:07:14
    bisa sangat relevan di
    00:07:15
    dalam hal eksploitasi.
    00:07:17
    Poin lain yang penting,
    00:07:19
    Kita melihat bahwa kolom yang
    00:07:21
    awalnya kosong di.
    00:07:23
    Dalam file telah di sini telah
    00:07:25
    diselesaikan dengan nilai nol,
    00:07:27
    Jadi itu sangat penting dan Anda tidak
    00:07:30
    Jangan pernah menemukan nilai yang benar-benar kosong.
    00:07:32
    Sebenarnya
    00:07:33
    Sejak kekuatan kueri
    00:07:34
    secara otomatis dan mampu melakukannya dengan baik,
    00:07:35
    Dia akan menggantinya dengan nol.
    00:07:37
    Seharusnya tidak dipahami oleh teks nyata,
    00:07:40
    kata-kata yang nyata,
    00:07:41
    itu hanya sebuah visi,
    00:07:44
    cara untuk memvisualisasikan nilainya,
    00:07:46
    Fakta bahwa nilainya kosong.
    00:07:48
    Tapi seperti yang Anda lihat,
    00:07:49
    itu dalam huruf miring dan karena itu
    00:07:50
    tidak memiliki nilai nyata.
    00:07:52
    Di sisi lain, kita bisa melakukan segalanya untuk
    00:07:53
    membuat katakanlah misalnya.
    00:07:54
    Saya menghapus semua nilai null
    00:07:56
    dari sebuah kolom dan tiba-tiba ada itu memberi kita
    00:07:59
    banyak membantu untuk memiliki sebutan
    00:08:00
    untuk ini karena tidak adanya nilai.
    00:08:04
    Kemudian kita akan memiliki departemen.
    00:08:08
    Periode kota,
    00:08:09
    Jadi ya, di sini,
    00:08:09
    Tidak terlalu menjadi masalah.
    00:08:11
    Kata yang biasa di awal,
    00:08:13
    Kami melihat bahwa ada yang kecil
    00:08:14
    masalah format sekolah,
    00:08:14
    kami dicampur dengan angka dan bulan,
    00:08:18
    tetapi informasinya relevan,
    00:08:19
    Jadi kita akan melihat bagaimana
    00:08:21
    Memanipulasi situs web mengapa tidak?
    00:08:23
    Kami akan dapat mengeksploitasinya.
    00:08:25
    Nomor identifikasi,
    00:08:27
    Jadi itu cukup penting,
    00:08:28
    Kami akan menyimpannya juga.
    00:08:30
    Kotamadya utama?
    00:08:32
    Komune lain di sana,
    00:08:33
    Ini adalah kasus pertama di mana kita akan melakukannya
    00:08:35
    memiliki sedikit lebih banyak masalah
    00:08:37
    untuk mengeksploitasi karena sudah akan
    00:08:39
    cukup rumit untuk dikatakan
    00:08:40
    bahwa pada sebuah festival akan kita perhatikan
    00:08:42
    Beberapa kotamadya misalnya
    00:08:43
    untuk ditampilkan di peta,
    00:08:45
    itu akan jauh lebih sederhana
    00:08:46
    hanya memiliki satu poin dan
    00:08:48
    Selain itu di flyover di milik kami.
    00:08:51
    Baca kolom kami,
    00:08:53
    Kami melihat bahwa itu kosong dalam 90% kasus,
    00:08:56
    Jadi di sini kita biasanya pada kasus di mana itu
    00:08:59
    tidak relevan untuk menyimpan kolom,
    00:09:02
    Jadi kita akan memiliki beberapa metode,
    00:09:04
    eh untuk menghapus kolom,
    00:09:05
    yang pertama saya tunjukkan di sini,
    00:09:06
    itu hanya untuk memilihnya,
    00:09:09
    untuk membuat klik kanan yang akan terbuka
    00:09:11
    Seluruh panel kontrol
    00:09:12
    yang berhubungan sangat luas
    00:09:13
    apa yang akan Anda temukan,
    00:09:15
    terutama di tab
    00:09:17
    transformasi langsung di dalam
    00:09:19
    yang berkuasa saya dan ini dia
    00:09:22
    Cukup klik hapus.
    00:09:25
    Kami melihat bahwa sebuah langkah baru saja ditambahkan,
    00:09:27
    ya, di sini.
    00:09:30
    Jadi kita akan melanjutkan di sini
    00:09:34
    eksplorasi kami,
    00:09:35
    jadi tanggal mulai,
    00:09:37
    Jadi kami melihat bahwa itu banyak hilang,
    00:09:39
    tapi masih oke
    00:09:40
    berguna untuk nanti,
    00:09:41
    Karena khususnya untuk membuat
    00:09:43
    representasi pada saat,
    00:09:44
    dari volume festival jadi kami akan menyimpannya.
    00:09:47
    Tanggal akhir, tanggal pembuatan,
    00:09:49
    kode pos dengan sangat baik,
    00:09:50
    Kode pos dan kode INSEE.
    00:09:52
    Jadi di sini kita dalam kasus kita,
    00:09:55
    Sudah kubilang,
    00:09:55
    Kami sebagian besar akan melakukan pekerjaan dari
    00:09:58
    dari kode pos jadi kode INSEE
    00:10:00
    Ini adalah sesuatu yang sangat berbeda.
    00:10:03
    Jadi itu adalah,
    00:10:03
    Ini adalah cara lain dari
    00:10:05
    menunjuk kotamadya dan itu
    00:10:07
    tidak akan terlalu menarik bagiku.
    00:10:09
    Jadi di sini saya lebih suka cenderung
    00:10:12
    untuk dihapus kolom ini
    00:10:15
    Jadi ada kode kode itu.
    00:10:18
    Karena cocok untuk lebih atau
    00:10:20
    kurang bagi saya untuk duplikat kode pos.
    00:10:23
    Ini hanya format yang sedikit lebih rumit.
    00:10:27
    Jadi, metode lain
    00:10:28
    untuk menghapus kolom,
    00:10:30
    Jadi di sini kita akan memilihnya.
    00:10:32
    Kita akan pergi ke resepsi
    00:10:33
    Dan kita lihat di sini bahwa kita memiliki barang.
    00:10:35
    Kelola kolom dan di sana itu akan
    00:10:37
    menawarkan kami 2 hal jadi 2
    00:10:39
    memilih untuk menghapus sekolah,
    00:10:41
    jadi hapus kolom.
    00:10:41
    Bah cukup sederhana ya,
    00:10:42
    Itu tidak menghapus
    00:10:44
    kolom yang saya pilih dan
    00:10:46
    jadi FYI saya bisa melakukan segalanya
    00:10:48
    dilakukan dengan memegang modal atau
    00:10:50
    Kontrol atas ulasan saya di keyboard saya
    00:10:53
    untuk dapat memilih 2 kolom,
    00:10:55
    Kembali ke sini dan klik.
    00:10:58
    Menghapus kolom?
    00:10:59
    Jadi bagaimana jika saya melakukan ini di sini?
    00:11:01
    Jadi jelas, bisa kembali.
    00:11:02
    Ini akan menjadi kesempatan untuk menunjukkan kepada Anda.
    00:11:05
    Kami melihat bahwa, Yah,
    00:11:06
    dia menghapus les,
    00:11:09
    2 kolom sekaligus.
    00:11:10
    Jadi kita akan kembali.
    00:11:13
    Kita akan kembali ke kode insee kita.
    00:11:17
    Dan kita akan kembali ke sini.
    00:11:20
    Bidang yang ingin saya tunjukkan,
    00:11:22
    jadi kelola kolom yang dihapus dan
    00:11:23
    Sekarang saya memiliki opsi lain yang
    00:11:25
    adalah menghapus kolom lainnya,
    00:11:27
    Jadi di sana akan berpengaruh
    00:11:28
    persis terbalik yang akan menjadi
    00:11:30
    menghapus semua Kolom kecuali
    00:11:31
    yang saya pilih.
    00:11:32
    Jadi sama kita akan terapkan tapi tidak
    00:11:34
    Panik kita bisa kembali.
    00:11:36
    Jadi Anda lihat di sini,
    00:11:38
    Dia hanya menyimpan kolom saya.
    00:11:42
    Jadi kita kembali lagi.
    00:11:45
    Dan untuk menunjukkan kepada Anda yang terbaru
    00:11:47
    Fungsionalitas di sekitar kita
    00:11:49
    akan kembali ke kode kami di C
    00:11:51
    dan kita akan memiliki kebalikannya,
    00:11:53
    yaitu memilih kolom,
    00:11:54
    pilih kolom,
    00:11:55
    Ini hanya akan mengatakan,
    00:11:57
    Yah, saya memilih.
    00:11:59
    Kolom yang menarik minat saya di sini,
    00:12:01
    Saya akan memiliki bidang yang akan terbuka,
    00:12:02
    Jadi di sana, di sini,
    00:12:03
    Saya hanya perlu melepaskan potensi,
    00:12:07
    kolom potensial yang
    00:12:08
    Saya tidak tertarik.
    00:12:10
    Jadi dia hanya akan pergi kepadaku.
    00:12:11
    simpan yang saya pilih
    00:12:13
    dan dengan cara yang sama.
    00:12:17
    Jika saya mencari kolom
    00:12:18
    Terutama karena saya tidak
    00:12:20
    tidak menemukannya dalam daftar,
    00:12:21
    Saya akan dapat di sini misalnya,
    00:12:22
    Klik. Untuk kode insee saya yang terkenal.
    00:12:30
    Jadi kode pin saya ada di sini itu
    00:12:32
    kodenya tertinggal di sini,
    00:12:33
    Saya memilih dan karena itu siapa yang akan
    00:12:35
    Bawa saya langsung ke kolom
    00:12:37
    karena setelah berpotensi
    00:12:39
    hapus jadi di sini saya akan
    00:12:41
    Kembali ke menu hop saya, saya akan
    00:12:44
    Minta kolom dihapus.
    00:12:47
    Atau tidak, pilih kolom
    00:12:48
    Pilih kolom.
    00:12:52
    Dan di sana, kita melihat itu.
    00:12:55
    Kotamadya lain karena
    00:12:56
    bahwa saya menghapus langkahnya,
    00:12:58
    hadir lagi,
    00:13:00
    Jadi di sini saya akan mengklik
    00:13:03
    Pasti
    00:13:05
    Juga unengage kode INSEE.
    00:13:07
    Saya klik OK.
    00:13:09
    Jadi di sana kita melihat bahwa saya memiliki item baru
    00:13:12
    yang baru saja dihapus.
    00:13:16
    Sehingga kita akan dapat
    00:13:17
    melanjutkan pekerjaan kami,
    00:13:18
    Jadi di sini kita memiliki kata-kata komune
    00:13:21
    Jadi itulah kata-kata komune.
    00:13:23
    Sebagai informasi,
    00:13:24
    Kami sudah memilikinya di sini jadi itu
    00:13:26
    sebagai utama jadi tidak terlalu
    00:13:29
    relevan untuk menyimpan kolom ini
    00:13:30
    Jadi di sini kita akan melakukannya dari
    00:13:32
    cara klasik dengan menghapus.
    00:13:36
    Apa selanjutnya? Kami akan terus
    00:13:41
    jadi periksa departemen SK,
    00:13:43
    itu informasi
    00:13:45
    yang kami miliki di tempat lain.
    00:13:47
    Sedikit lebih jauh.
    00:13:51
    Ini adalah departemen yang ada di sini
    00:13:53
    jadi tidak perlu disimpan.
    00:13:56
    Kolom itu?
    00:13:58
    Anda melihat satu di tempat lain yang ada di sini
    00:14:01
    Kolom yang dihapus tidak
    00:14:03
    itu satu langkah dan kita melihatnya di
    00:14:06
    Lembar ini di sini dia akan memberitahuku
    00:14:08
    jadi itu M jadi itu
    00:14:11
    mashup pada dasarnya adalah kode yang
    00:14:12
    dihasilkan pada setiap langkah saya
    00:14:14
    jadi saya tidak cocok sama sekali
    00:14:15
    Detail untuk saat ini
    00:14:16
    Kita akan punya waktu untuk membicarakannya lagi
    00:14:18
    tetapi bagaimanapun juga itu memungkinkan Anda,
    00:14:19
    Jika Anda tiba di at,
    00:14:21
    Bacalah untuk mengetahui sedikit
    00:14:23
    apa yang terjadi di negara bagian.
    00:14:25
    Jadi di sini,
    00:14:26
    Saya menghapus departemen dan K dan
    00:14:30
    Kemudian kami memiliki volume peserta kami.
    00:14:33
    2018 2017 jadi di sana kami cukup bagus,
    00:14:34
    Kami akan membuat umpan lain.
    00:14:35
    Nama acara
    00:14:36
    tidak ada masalah,
    00:14:37
    wilayah domain sepenuhnya,
    00:14:38
    periodisitas departemen domain,
    00:14:40
    mulai bulan, situs web,
    00:14:43
    nomor identifikasi,
    00:14:44
    kotamadya, jumlah edisi,
    00:14:46
    tanggal mulai dari tanggal akhir,
    00:14:48
    tanggal pembuatan,
    00:14:49
    kode pos, kode INSEE,
    00:14:51
    nama departemen dan 2
    00:14:54
    Volume peserta untuk 2018.
    00:14:56
    Oleh karena itu, pada tahun 2017,
    00:14:57
    dari sana,
    00:14:58
    Kami dapat menganggap bahwa kami telah menghapus
    00:15:00
    semua kolom yang tidak
    00:15:01
    tidak perlu untuk proyek kami.

    Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
    Effectuez une autre recherche ou retournez au contenu !

     

    00:00:02
    Então, agora que estamos
    00:00:03
    salva nosso arquivo,
    00:00:04
    Vamos poder começar a fazer
    00:00:06
    o nosso primeiro reprocessamento,
    00:00:07
    Então, para isso, uma vez que estamos aqui,
    00:00:08
    Vamos entrar em Transformar Dados.
    00:00:11
    Transforme os dados que irão
    00:00:13
    permitir-nos apresentar o Power Query
    00:00:15
    E o primeiro elemento interessante,
    00:00:17
    Podemos ver que já houve etapas
    00:00:18
    reprocessamento quando temos
    00:00:20
    Nada pedia a uma lembrança,
    00:00:21
    Nós apenas fizemos uma carga de dados
    00:00:23
    e foi por isso que o fizemos.
    00:00:24
    Foi para mostrar exatamente isso
    00:00:26
    o tipo de inteligência que
    00:00:28
    Pode haver em proverbial,
    00:00:29
    Então, nós basicamente o que pedimos,
    00:00:31
    É este primeiro passo que está aqui,
    00:00:32
    que é a fonte de dados.
    00:00:34
    Então, como um lembrete,
    00:00:35
    se eu clicar aqui no Pedro desdentado,
    00:00:38
    Vamos ter o caminho
    00:00:39
    para o arquivo, se você for enganado,
    00:00:41
    Bem, você pode clicar aqui
    00:00:42
    na navegação. Voltar a fazê-lo?
    00:00:46
    E então vamos para a navegação,
    00:00:48
    Então isso é normal, ,
    00:00:49
    Foi quando selecionamos o
    00:00:51
    um para poder trabalhar e por
    00:00:53
    Contra o que é interessante é
    00:00:54
    que detetou automaticamente a seringa
    00:00:56
    O facto de o quadro conter
    00:00:58
    Então isso é muito bom.
    00:01:00
    Isto tem a ver com o facto de o
    00:01:02
    em Excel foi muito bem preparado
    00:01:04
    no sentido em que foi declarado em
    00:01:07
    como uma tabela no Excel, então isso
    00:01:10
    o que explica depois disso
    00:01:12
    inteligência desde o Excel
    00:01:13
    também é a Microsoft e vemos
    00:01:15
    Outro elemento é esse.
    00:01:17
    Ele mudou.
    00:01:18
    E os tipos de alguns,
    00:01:21
    determinadas colunas,
    00:01:21
    Então, aqui, por outro lado,
    00:01:23
    Também vai demorar um pouco
    00:01:24
    desconfie um pouco disso,
    00:01:25
    o que ele pode deduzir certas coisas
    00:01:26
    que, por enquanto, não estão
    00:01:29
    Necessariamente verdadeiro, por isso implicará
    00:01:30
    De qualquer forma, verifique o tipo.
    00:01:32
    Como lembrete,
    00:01:33
    O tipo está aqui assim em cada coluna
    00:01:36
    poder alterar o tipo da,
    00:01:38
    da coluna e isso é interessante
    00:01:40
    precisamente para poder fazer
    00:01:42
    somas, por exemplo, números,
    00:01:44
    números de potência,
    00:01:46
    Calcule durações entre 2 datas.
    00:01:48
    Então aqui vamos precisar de datas.
    00:01:50
    Ser capaz de fazer concatenações do
    00:01:52
    Detalhamentos por meio de uma coluna de texto.
    00:01:54
    et cetera, et cetera.
    00:01:56
    Então esse é um passo muito importante
    00:01:58
    Então aqui vamos dizer que o Poder
    00:02:01
    Courrier fez o seu trabalho muito bem
    00:02:03
    E vamos poder começar um pouco
    00:02:06
    poucos para continuar as mudanças.
    00:02:08
    Então, o primeiro passo que eu
    00:02:10
    aconselha-o lá no momento em que você tem
    00:02:12
    trouxe o seu primeiro conjunto de dados,
    00:02:14
    é ordenar as colunas
    00:02:16
    que você recuperou quando nós
    00:02:19
    explorou o arquivo no Excel,
    00:02:20
    Vimos que tínhamos potencial
    00:02:22
    duplicados.
    00:02:22
    Coisas que não eram necessariamente
    00:02:24
    interessante para manter em
    00:02:26
    no arquivo e assim vamos
    00:02:28
    tentando descobrir um pouco sobre o
    00:02:30
    Nesse caso, as colunas devem ser excluídas.
    00:02:34
    Em seguida,
    00:02:35
    Digamos que estamos trabalhando em
    00:02:37
    Número de dados relativos às vendas realizadas
    00:02:39
    por um, por uma empresa.
    00:02:41
    Então, quais são os grandes passos
    00:02:43
    em que podemos dizer a nós mesmos que temos
    00:02:44
    o direito de, finalmente, suprimir esse direito,
    00:02:46
    A capacidade de excluir uma coluna?
    00:02:48
    A primeira é que os dados
    00:02:51
    são desnecessárias para o projeto.
    00:02:53
    Aqui estamos no um contra um,
    00:02:57
    num resumo de vendas que
    00:02:59
    foram realizadas por uma empresa,
    00:03:01
    por exemplo, para ter o número
    00:03:03
    números de telefone dos clientes.
    00:03:04
    Em uma ferramenta de visualização,
    00:03:06
    Não vai me fazer muito bem.
    00:03:09
    Então, por que manter esta coluna?
    00:03:11
    isso vai poluir a minha pintura,
    00:03:13
    que potencialmente pesará
    00:03:15
    também o meu ficheiro,
    00:03:17
    Então, há potencialmente se for
    00:03:18
    inútil para o que estou tentando fazer,
    00:03:21
    Bem, eu posso excluir a coluna.
    00:03:24
    Note que se ainda não está
    00:03:26
    certeza de que a coluna é útil para você,
    00:03:29
    Você pode absolutamente deixá-lo e
    00:03:31
    suprimi-lo posteriormente, ,
    00:03:32
    É totalmente possível fazer
    00:03:34
    supressões um pouco incrementais,
    00:03:36
    um pouco mais tarde no reprocessamento.
    00:03:39
    Outro elemento,
    00:03:40
    são duplicados,
    00:03:41
    Por isso, acontece com muita frequência
    00:03:43
    Aquilo a que frequentemente nos ligamos
    00:03:44
    fontes técnicas,
    00:03:46
    Então é o fato de que 2
    00:03:49
    as colunas sobem sensivelmente,
    00:03:50
    é exatamente a mesma informação, ou
    00:03:52
    ou quase.
    00:03:53
    Então, depois de uma questão de formato, o
    00:03:55
    A mesma informação, por exemplo
    00:03:56
    aqui no caso que eu dou estes 2
    00:03:59
    colunas com indicação do mês da venda,
    00:04:00
    há um que está em formato escrito,
    00:04:02
    Então seria escrito em anexo e o outro formato.
    00:04:04
    Não, vai ser escrito 6, então isso é típico
    00:04:06
    Não é útil manter os 2
    00:04:08
    É a mesma informação.
    00:04:10
    Então essa é a parte mais lógica,
    00:04:11
    é apenas para manter o
    00:04:13
    formato que melhor nos convém,
    00:04:14
    Então, potencialmente, a figura,
    00:04:16
    porque eu tenderia a
    00:04:20
    fazer e, em seguida, excluir
    00:04:22
    A coluna de teste de texto.
    00:04:24
    Dê uma consistência,
    00:04:26
    Assim, aqui nos encontramos em um
    00:04:29
    coluna ou em 95% dos casos,
    00:04:31
    Os dados não estão disponíveis, portanto,
    00:04:33
    É realmente relevante?
    00:04:35
    para manter uma coluna onde também existe
    00:04:38
    Mais do que tão poucos dados presentes
    00:04:40
    E assim há no caso que eu estou dando
    00:04:43
    Codifique o código Vamos imaginar um código de barras?
    00:04:45
    O identificador raramente é inserido
    00:04:49
    Então, e o que eu vou conseguir realmente
    00:04:52
    Explorar dados em 5% das linhas.
    00:04:54
    Talvez não
    00:04:55
    e, portanto, nesse caso, é mais
    00:04:57
    Exclua a coluna.
    00:04:59
    E o último elemento,
    00:05:01
    são dados de baixa qualidade,
    00:05:03
    Então, digamos que você tenha um
    00:05:05
    coluna rotulada Código
    00:05:06
    e que, de vez em quando,
    00:05:07
    Você vai encontrar mais
    00:05:09
    o nome da loja,
    00:05:11
    Então, de vez em quando,
    00:05:12
    Imaginemos até em metade dos casos,
    00:05:14
    ou mesmo demasiado,
    00:05:14
    o nome da loja para que ele prove
    00:05:16
    um pouco de um problema que
    00:05:18
    pode ter tido em torno desta coluna
    00:05:20
    e, portanto, potencialmente até mesmo o
    00:05:22
    códigos postais presentes,
    00:05:23
    que seria normalmente o formato correto,
    00:05:25
    são potencialmente falsas e, portanto,
    00:05:27
    Tenha cuidado, pode ser perigoso.
    00:05:29
    Mais uma vez
    00:05:31
    Não é necessário eliminar a seringa
    00:05:33
    colunas em caso de dúvida,
    00:05:36
    Você pode fazer isso um pouco mais tarde.
    00:05:37
    Mas, no geral, quando você tem um
    00:05:39
    um pouco a resposta para a mente,
    00:05:41
    Bem, você pode diretamente
    00:05:43
    Exclua a coluna.
    00:05:45
    Então, para isso, vamos dar a volta por cima,
    00:05:47
    vamos para o Power Query.
    00:05:53
    Aqui, lá está, vamos desfrutar por sinal
    00:05:56
    Para renomear nosso conjunto de dados
    00:05:58
    que chamaremos aqui de festival. Aqui tens.
    00:06:05
    E vamos conseguir fazer um pouco
    00:06:07
    olhe para o nosso conjunto de dados,
    00:06:09
    portanto, o nome do evento
    00:06:12
    Não tenho nenhum problema com isso.
    00:06:14
    A região também não,
    00:06:16
    O domínio do suplemento de domínio.
    00:06:19
    Não parece muito cheio então
    00:06:21
    Como eu sei o que é muito
    00:06:23
    cheio ou não muito cheio,
    00:06:25
    Então você tem este sub-bar aqui
    00:06:26
    isso vai lhe dar um número
    00:06:29
    informação muito interessante.
    00:06:30
    Então, o fato de que nós vamos ter por
    00:06:34
    exemplo aqui 67% Conclusão do
    00:06:37
    da coluna em 67% dos casos,
    00:06:40
    A linha tem um valor.
    00:06:42
    Ele também vai nos dar
    00:06:44
    um indicador de erro,
    00:06:46
    então potencialmente linhas
    00:06:47
    que contenham erros.
    00:06:48
    Veremos os tipos de erros
    00:06:50
    que são possíveis.
    00:06:51
    E, em seguida, o número de colunas vazias.
    00:06:54
    E isso, de repente, você vê aqui,
    00:06:55
    quando está verde,
    00:06:56
    Bem, esse é o,
    00:06:58
    O indicador de conclusão por grosso de
    00:07:00
    o da coluna e não dá
    00:07:03
    Já aqui estão as opções para excluir
    00:07:04
    por exemplo, artigos vazios,
    00:07:06
    Ou seja, as linhas que são,
    00:07:08
    que estão vazios tão obviamente lá,
    00:07:09
    Vamos lá
    00:07:10
    Não vamos fazê-lo porque temos
    00:07:12
    2/3 de colunas preenchidas de modo a que
    00:07:14
    pode ser bastante relevante
    00:07:15
    em termos de exploração.
    00:07:17
    Outro ponto é importante,
    00:07:19
    Podemos ver que as colunas que
    00:07:21
    estão inicialmente vazios na.
    00:07:23
    No ficheiro foram
    00:07:25
    preenchido com um valor nulo,
    00:07:27
    Então isso é muito importante e você não
    00:07:30
    nunca encontrará um valor verdadeiramente vazio.
    00:07:32
    Na verdade
    00:07:33
    desde o poder da consulta
    00:07:34
    automaticamente e ser capaz de fazer bem,
    00:07:35
    Vai substituir isso por nulo.
    00:07:37
    Isto não deve ser entendido por um texto real,
    00:07:40
    redação real,
    00:07:41
    É apenas uma visão,
    00:07:44
    uma maneira de visualizar o valor,
    00:07:46
    o facto de o valor estar vazio.
    00:07:48
    Mas, como você pode ver,
    00:07:49
    está em itálico e, portanto,
    00:07:50
    realmente não tem qualquer valor.
    00:07:52
    Por outro lado, seremos capazes de
    00:07:53
    faz dizer, por exemplo.
    00:07:54
    Eu retiro todos os valores nulos
    00:07:56
    de uma coluna e de repente
    00:07:59
    Ajuda muito ter uma denominação
    00:08:00
    para isso pela ausência de valor.
    00:08:04
    Depois vamos ter o departamento.
    00:08:08
    O período da cidade,
    00:08:09
    Então, sim, aqui,
    00:08:09
    Nenhum problema em particular.
    00:08:11
    A palavra habitual no início,
    00:08:13
    Podemos ver que há poucos
    00:08:14
    preocupações com o formato escolar,
    00:08:14
    Fomos confundidos com o número e o mês,
    00:08:18
    mas a informação é relevante,
    00:08:19
    Então vamos ver como o D
    00:08:21
    Manipular o site, por que não?
    00:08:23
    Poderemos explorá-lo.
    00:08:25
    Número de identificação,
    00:08:27
    Então isso é muito importante,
    00:08:28
    Vamos mantê-lo também.
    00:08:30
    O município principal?
    00:08:32
    Então, outra cidade lá,
    00:08:33
    Este é o primeiro caso em que vamos
    00:08:35
    ter um pouco mais de problemas
    00:08:37
    para explorar porque já está tudo bem
    00:08:39
    ser bastante complicado de dizer a si mesmo
    00:08:40
    que num festival vamos estar
    00:08:42
    Por exemplo, vários municípios
    00:08:43
    Para exibir em um mapa,
    00:08:45
    Será muito mais simples
    00:08:46
    ter apenas um ponto e
    00:08:48
    Ainda por cima ao pairar sobre o nosso.
    00:08:51
    Leia a nossa coluna,
    00:08:53
    Vemos que está vazio em 90% dos casos,
    00:08:56
    Portanto, este é tipicamente um caso em que
    00:08:59
    não é relevante para manter a coluna,
    00:09:02
    Então vamos ter vários métodos,
    00:09:04
    Para excluir uma coluna,
    00:09:05
    O primeiro que estou mostrando aqui,
    00:09:06
    é apenas uma questão de selecioná-lo,
    00:09:09
    para clicar com o botão direito do rato que irá abrir
    00:09:11
    Um painel de controle inteiro
    00:09:12
    o que corresponde, em termos muito gerais, a
    00:09:13
    ao que você vai encontrar,
    00:09:15
    especialmente no período de
    00:09:17
    transformação direta em
    00:09:19
    o no poder eu e aqui vamos nós
    00:09:22
    Basta clicar em Excluir.
    00:09:25
    Podemos ver que acaba de ser acrescentado um passo a este passo.
    00:09:27
    Aqui.
    00:09:30
    E assim vamos continuar aqui
    00:09:34
    a nossa exploração,
    00:09:35
    portanto, a data de início,
    00:09:37
    Então a gente vê que está faltando muito,
    00:09:39
    mas está tudo bem de qualquer maneira
    00:09:40
    ser útil para mim para mais tarde,
    00:09:41
    Porque, em particular, fazer
    00:09:43
    performances na época do século XX,
    00:09:44
    do volume do festival, então vamos mantê-lo.
    00:09:47
    A data de fim, a data de criação,
    00:09:49
    o código postal muito bem,
    00:09:50
    código postal e código INSEE.
    00:09:52
    Então, aqui nós, no nosso caso,
    00:09:55
    Eu lhe digo,
    00:09:55
    Nós vamos principalmente fazer algum trabalho de
    00:09:58
    do código postal, ou seja, o código INSEE
    00:10:00
    É algo bem diferente.
    00:10:03
    Então é um,
    00:10:03
    É outra forma de
    00:10:05
    designar um município e que
    00:10:07
    Eu não vou estar muito interessado nisso.
    00:10:09
    Então aqui eu vou tender a tender:
    00:10:12
    Para eliminar esta coluna
    00:10:15
    Então, aí, código de código, isto é.
    00:10:18
    Porque serve para mais ou menos
    00:10:20
    menos para mim a uma duplicata do código postal.
    00:10:23
    É apenas um formato um pouco mais complicado.
    00:10:27
    Então, outro método
    00:10:28
    Para excluir uma coluna,
    00:10:30
    Então vamos selecioná-lo aqui.
    00:10:32
    Vamos para o
    00:10:33
    E vemos aqui que temos um item.
    00:10:35
    Gerencie as colunas e lá vai
    00:10:37
    Ofereça-nos 2 coisas, ou seja, 2
    00:10:39
    optar por suprimir a escola, ou
    00:10:41
    portanto, exclua as colunas.
    00:10:41
    É muito simples,
    00:10:42
    Não removeu o
    00:10:44
    colunas que seleciono e
    00:10:46
    então FYI eu posso fazer qualquer coisa
    00:10:48
    a efetuado segurando maiúsculas ou
    00:10:50
    Controlo sobre o meu comentário no meu teclado
    00:10:53
    para poder selecionar 2 colunas,
    00:10:55
    para voltar aqui e clicar.
    00:10:58
    Excluir colunas?
    00:10:59
    Então, e se eu fizer isso aqui?
    00:11:01
    Então, obviamente, será capaz de voltar.
    00:11:02
    Esta será uma oportunidade para lhe mostrar.
    00:11:05
    Podemos ver que, bem,
    00:11:06
    Ele tirou meus les,
    00:11:09
    2 colunas ao mesmo tempo.
    00:11:10
    Então vamos voltar.
    00:11:13
    Vamos voltar ao nosso código INSEE.
    00:11:17
    E vamos voltar aqui.
    00:11:20
    O campo que quero mostrar,
    00:11:22
    portanto, gerencie colunas excluídas e
    00:11:23
    Agora eu tenho outra opção que
    00:11:25
    é excluir as outras colunas,
    00:11:27
    Então isso vai ter o efeito
    00:11:28
    exatamente invertido, que vai ser
    00:11:30
    excluir todas as colunas, exceto
    00:11:31
    os que selecionei.
    00:11:32
    Então vamos aplicar a mesma coisa, mas não
    00:11:34
    Pânico, podemos voltar.
    00:11:36
    Então você vê aqui,
    00:11:38
    Ele só mantinha minhas colunas.
    00:11:42
    Então, vamos voltar novamente.
    00:11:45
    E para lhe mostrar as últimas novidades
    00:11:47
    funcionalidade em torno do que nós
    00:11:49
    voltará ao nosso código em C
    00:11:51
    E vamos ter o inverso estrito,
    00:11:53
    ou seja, escolha as colunas,
    00:11:54
    escolha as colunas,
    00:11:55
    Vai ser apenas sobre dizer a si mesmo:
    00:11:57
    Bem, eu escolho.
    00:11:59
    Então, a coluna que me interessa aqui,
    00:12:01
    Vou ter um campo que vai se abrir,
    00:12:02
    Então, ali mesmo, aqui mesmo,
    00:12:03
    Tudo o que tenho de fazer é desafixar os potenciais,
    00:12:07
    colunas potenciais que
    00:12:08
    Não estou interessado.
    00:12:10
    E por isso só vai para mim
    00:12:11
    Manter o que selecionei
    00:12:13
    e da mesma forma.
    00:12:17
    Se estou à procura de uma coluna
    00:12:18
    especialmente porque eu não
    00:12:20
    não consegue encontrá-lo na lista,
    00:12:21
    Eu vou poder aqui, por exemplo,
    00:12:22
    Clique. Ao meu famoso código INSEE.
    00:12:30
    Então o meu código PIN está aqui
    00:12:32
    O código é deixado aqui,
    00:12:33
    Eu seleciono e então quem vai
    00:12:35
    Leve-me direto para a coluna
    00:12:37
    para potencialmente após a seringa
    00:12:39
    Excluir então aqui eu vou
    00:12:41
    Voltar ao meu menu que vou
    00:12:44
    Exclua as colunas.
    00:12:47
    Ou não, escolha as colunas
    00:12:48
    Segure escolha as colunas.
    00:12:52
    E então, vemos isso.
    00:12:55
    Os outros municípios porque
    00:12:56
    que eu apaguei a etapa,
    00:12:58
    está novamente presente,
    00:13:00
    Então eu vou clicar em alguns
    00:13:03
    comprometido com outros municípios e eu vou
    00:13:05
    também desligue o código INSEE.
    00:13:07
    Vou clicar em OK.
    00:13:09
    E então aqui vemos que eu tenho um novo item
    00:13:12
    que acaba de ser suprimido.
    00:13:16
    E assim vamos conseguir
    00:13:17
    continuar o nosso trabalho,
    00:13:18
    Então aqui temos a redação do município
    00:13:21
    Então essa é a redação da comuna.
    00:13:23
    Para informações, consultar:
    00:13:24
    Nós já tínhamos isso aqui, então é
    00:13:26
    como um principal, então não muito
    00:13:29
    Relevante para manter esta coluna
    00:13:30
    Então agora vamos fazer isso de uma forma que
    00:13:32
    a maneira clássica de excluir.
    00:13:36
    O que vem a seguir? Vamos continuar a
    00:13:41
    então verifique o departamento SK,
    00:13:43
    é uma informação
    00:13:45
    que tínhamos.
    00:13:47
    Um pouco mais adiante.
    00:13:51
    Esse é o departamento que está aqui
    00:13:53
    então não há necessidade de manter.
    00:13:56
    Essa coluna?
    00:13:58
    Você vê um pelo caminho que aqui
    00:14:01
    As colunas excluídas não são
    00:14:03
    apenas um passo e vemos isso em
    00:14:06
    Esta folha aqui vai me dizer
    00:14:08
    então esse é o M, então esse é o
    00:14:11
    mashup é basicamente o código que
    00:14:12
    é gerado em cada uma das minhas etapas
    00:14:14
    Então eu não me encaixo nisso de jeito nenhum
    00:14:15
    O detalhe por enquanto sobre ele
    00:14:16
    Teremos tempo para falar sobre isso novamente
    00:14:18
    mas, em qualquer caso, permite-lhe,
    00:14:19
    Se você chegar a ele,
    00:14:21
    Leia para saber um pouco
    00:14:23
    o que está acontecendo no estado.
    00:14:25
    Então aqui estamos,
    00:14:26
    Eu apaguei o departamento e K e
    00:14:30
    Depois temos o nosso volume de participantes.
    00:14:33
    2018 2017 então somos muito bons,
    00:14:34
    Vamos fazer outra passagem.
    00:14:35
    O nome do evento
    00:14:36
    não tem problema,
    00:14:37
    a região do domínio completamente,
    00:14:38
    Domínio, departamento, periodicidade,
    00:14:40
    mês de início, o site,
    00:14:43
    o número de identificação,
    00:14:44
    o município, o número da edição,
    00:14:46
    a data de início da data de fim,
    00:14:48
    a data de criação,
    00:14:49
    o código postal, o código INSEE,
    00:14:51
    o nome do departamento e os 2
    00:14:54
    volumes de participantes para 2018.
    00:14:56
    Em 2017, portanto,
    00:14:57
    A partir daí,
    00:14:58
    Pode considerar-se que eliminámos
    00:15:00
    todas as colunas que não foram
    00:15:01
    não é necessário para o nosso projeto.

    Il n’existe aucun élément correspondant à votre recherche dans cette vidéo...
    Effectuez une autre recherche ou retournez au contenu !

     

    Mandarine AI: CE QUI POURRAIT VOUS INTÉRESSER

    Rappel

    Afficher