奥鹏_国开24春《电子商务概论》形考作业
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">形考任务2</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">试卷总分:100 得分:100</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">1.1、下列关于<span style="color: black;">为何</span>要做数据清理描述错误的是( )</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.数据有重复</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.数据有错误</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.数据有缺失</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.数据量太大</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2.2、下列关于数据清理描述错误的是( )</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.数据清理能完全<span style="color: black;">处理</span>数据质量差的问题</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.数据清理在数据分析过程中是不可或缺的一个环节</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.数据清理的目的是<span style="color: black;">加强</span>数据质量</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.<span style="color: black;">能够</span>借助Kettle来完成<span style="color: black;">海量</span>的数据清理工作</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">3.3、下列关于<span style="color: black;">运用</span>参照表清洗数<span style="color: black;">据述</span>法错误的是( )</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.有些数据<span style="color: black;">没法</span>从内部<span style="color: black;">发掘</span>错误,<span style="color: black;">必须</span>结合<span style="color: black;">外边</span>的数据进行参照</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.只要<span style="color: black;">办法</span>得当,数据内部是<span style="color: black;">能够</span><span style="color: black;">发掘</span>错误的,不<span style="color: black;">必须</span>借助参照表</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.<span style="color: black;">运用</span>参数表<span style="color: black;">能够</span>校验数据的准确性</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.<span style="color: black;">运用</span>参照表<span style="color: black;">能够</span>处理数据的一致性</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">4.4、某店铺2019年度会员信息表中,某会员的出生年份是1990年,但年龄却记录为25岁,此类错误<span style="color: black;">必须</span>进行( )。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.缺失值清洗</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.重复值清洗</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.<span style="color: black;">规律</span>值清洗</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.无价值数据清洗</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">5.5、关于数据清洗的<span style="color: black;">功效</span>,下列说法正确的是( )。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.去重、补漏、计算</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.去重、补漏、纠错</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.补漏、纠错、计算</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.去重、计算、纠错</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">6.6、数据清洗时,运营数据中<span style="color: black;">显现</span>“下单时间2088-12-12”,属于( )。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.缺失值清洗</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.格式内容清洗</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.<span style="color: black;">规律</span>错误清洗</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.重复数据清洗</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">7.7、以下说法错误的是( )</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.数据预处理的<span style="color: black;">重点</span>流程为数据清理、数据集成、数据变换与数据归约</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.数据清理、数据集成、数据变换、数据归约这些<span style="color: black;">过程</span>在数据预处理活动中<span style="color: black;">必要</span><span style="color: black;">次序</span><span style="color: black;">运用</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.冗余数据的删除既是一种数据清理形式,<span style="color: black;">亦</span>是一种数据归约</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.<span style="color: black;">全部</span>预处理过程要<span style="color: black;">尽可能</span>人机结合,尤其要注重和客户以及专家多交流</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">8.8、处理噪声的<span style="color: black;">办法</span><span style="color: black;">通常</span>有( )</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.分箱</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.回归</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.聚类</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.以上都是</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">9.9、数据集成的过程中<span style="color: black;">必须</span>处理的问题有( )</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.实体识别</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.冗余与<span style="color: black;">关联</span>性分析。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.数据冲突和检测</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.以上都是</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">10.<span style="color: black;">十、</span>数据归约的<span style="color: black;">办法</span>有( )</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.维度归约</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.数量归约</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.数据压缩</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.以上都是</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">11.11、关于数据重塑的说法中,下列选项描述错误的是()。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.数据重塑<span style="color: black;">能够</span>将DataFrame转换为Series</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.stack()<span style="color: black;">办法</span><span style="color: black;">能够</span>将列索引转换为行索引</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.对一个DataFrame<span style="color: black;">运用</span>stack()<span style="color: black;">办法</span>后返回的<span style="color: black;">必定</span>是一个Series</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D..unstack()<span style="color: black;">办法</span><span style="color: black;">能够</span>将行索引转换为列索引</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">12.12.请阅读下面的程序: 执行<span style="color: black;">以上</span>程序后,<span style="color: black;">最后</span>输出的结果为()。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.0 False1 False2 True</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B..0 True1 True2 False</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C..0 False1 False2 False</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D..0 True1 True2 True</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">13.13、下列选项中,关于drop_duplicates()<span style="color: black;">办法</span>描述错误的是()。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.仅支持单一特征数据的去重</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B..仅对Series和DataFrame对象有效</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.数据去重时默认<span style="color: black;">保存</span><span style="color: black;">第1</span>个数据</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.该<span style="color: black;">办法</span>不会改变原始数据<span style="color: black;">摆列</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">14.14、下列选项中,关于dropna()<span style="color: black;">办法</span>描述正确的是()。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.dropna()<span style="color: black;">办法</span>只会删除值为NaN的数据</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.dropna()<span style="color: black;">办法</span>不会删除值为None的数据</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.dropna()<span style="color: black;">办法</span>会删除值为None和NaN的数据</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.dropna()<span style="color: black;">办法</span>只会检测缺失数据和空值</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">15.15、下列选项中,关于duplicated()<span style="color: black;">办法</span>描述正确的是()。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.duplicate()<span style="color: black;">办法</span>用于删除重复值</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.duplicate()<span style="color: black;">办法</span>用于标记重复值</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.duplicate()<span style="color: black;">办法</span>会改变原始数据</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.duplicate()<span style="color: black;">办法</span>会将重复的数据标记为False</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">16.16、下列选项中,属于数据处理的目的是()</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.使数据更加适用于分析</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.对无<span style="color: black;">道理</span>的数据进行清洗</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.整合数据</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.以上<span style="color: black;">所有</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">17.17、数据清洗的<span style="color: black;">重点</span>内容<span style="color: black;">包含</span>( )。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.缺失值清洗</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.格式内容清洗</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.<span style="color: black;">规律</span>错误清洗</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.以上<span style="color: black;">所有</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">18.18、在数据表里,缺失值<span style="color: black;">平常</span>的表现形式是( )。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.空值</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.错误标识符</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.#DIV/0!</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.1</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">19.19、数据清洗时,处理缺失值的<span style="color: black;">办法</span>不<span style="color: black;">包含</span>( )。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.删除单元格</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.删除记录</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.数据补齐</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.不处理</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">20.20、数据<span style="color: black;">规律</span>错误不<span style="color: black;">包含</span>( )。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.数据不<span style="color: black;">恰当</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.数据自相矛盾</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.数据不符合规则</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.数据格式错误</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">21.21、下列选项中,关于数据预处理说法正确的是()。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.数据清洗<span style="color: black;">包括</span>了数据标准化、数据合并和缺失值处理</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.数据合并<span style="color: black;">根据</span>合并轴的方向<span style="color: black;">重点</span>分为左连接、右连接、内连接和外连接</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.数据分析的预处理过程<span style="color: black;">包含</span>数据清洗、数据合并、数据标准化和数据转换,它们之间存在交叉,<span style="color: black;">无</span>严格的先后关系</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.数据标准化的<span style="color: black;">重点</span>对象是类别型特征</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">22.22、检测出<span style="color: black;">反常</span>值之后,<span style="color: black;">一般</span>会采用<span style="color: black;">那些</span>方式处理它们?()</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.直接将含有<span style="color: black;">反常</span>值的记录删除</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.用<span style="color: black;">详细</span>的值来进行替换,可用前后两个观测值的平均值修正该<span style="color: black;">反常</span>值</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.不处理,直接在<span style="color: black;">拥有</span><span style="color: black;">反常</span>值的数据集上进行统计分析</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.以上<span style="color: black;">所有</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">23.23、下列函数中,<span style="color: black;">能够</span>对数据进行的合并的是()。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.concat()</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B..join()</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C..merge()</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.以上<span style="color: black;">所有</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">24.24、下列<span style="color: black;">办法</span>中,<span style="color: black;">能够</span>修改数据类型的是()。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.desc()</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.to_numberic()</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.dim()</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.type()</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">25.25、下列关于重复值处理的说法中,错误的是()。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">A.duplicated()<span style="color: black;">办法</span><span style="color: black;">能够</span>标记重复数据</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">B.drop_duplicates()<span style="color: black;">办法</span>用于删除重复数据</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">C.重复数据的判断标准是两个数据中所有条目的值都相等</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">D.duplicated()<span style="color: black;">办法</span>支持从前向后和从后向前两种<span style="color: black;">查询</span>模式</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">26.<span style="color: black;">2、</span>判断题</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">1、数据预处理是数据挖掘中必不可少的关键一步,<span style="color: black;">更加是</span>进行数据挖掘前的准备工作。它一方面保论文作业答案请联系 : 证挖掘数据的正确性和有效性,另一方面<span style="color: black;">经过</span>对数据格式和内容的<span style="color: black;">调节</span>,使数据更符合挖掘的<span style="color: black;">必须</span>。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">27.2、重复数据会影响数据处理结果的正确性,从而<span style="color: black;">引起</span>数据分析<span style="color: black;">显现</span>偏差,<span style="color: black;">因此呢</span><span style="color: black;">必须</span>将其删除。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">28.3、<span style="color: black;">拥有</span>多层索引的DataFrame对象经过stack()重塑后,返回的是一个Series对象。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">29.4、<span style="color: black;">运用</span>merge()函数进行数据合并时,不<span style="color: black;">必须</span>指定合并键。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">30.5、fillna()<span style="color: black;">办法</span>处理缺失数据时<span style="color: black;">能够</span><span style="color: black;">运用</span>Series对象填充,但不<span style="color: black;">能够</span><span style="color: black;">运用</span>DataFrame对象填充。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">31.6、dropna()<span style="color: black;">办法</span>可以删除数据中所有的缺失值。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">32.7、drop_duplicated()<span style="color: black;">办法</span><span style="color: black;">能够</span>删除重复值。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">33.8、rename()<span style="color: black;">办法</span><span style="color: black;">能够</span>重命名索引名。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">34.9、<span style="color: black;">经过</span>merge()函数合并数据时<span style="color: black;">能够</span>指定多个键。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">35.<span style="color: black;">十、</span>join()<span style="color: black;">办法</span><span style="color: black;">能够</span><span style="color: black;">运用</span>左连接和右连接两种方式连接数据。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">36.11、关于Pandas中的数据重塑,stack()<span style="color: black;">办法</span><span style="color: black;">能够</span>将列索引转换为行索引。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">37.12、关于预处理中的数据合并,concat()函数是最常用的主键合并函数,<span style="color: black;">能够</span><span style="color: black;">经过</span>内连接和外连接的方式堆叠合并数据。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">38.13、关于预处理中的数据合并,merge()函数是最常用的主键合并的函数,但<span style="color: black;">不可</span>够<span style="color: black;">经过</span>左连接和右连接的方式合并数据。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">39.14、关于预处理中的数据合并,join()<span style="color: black;">办法</span>是最常用的主键合并<span style="color: black;">办法</span>之一,但<span style="color: black;">不可</span>够<span style="color: black;">经过</span>左连接和右连接的方式合并数据。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">40.15、Pandas中<span style="color: black;">能够</span><span style="color: black;">运用</span>boxplot()<span style="color: black;">办法</span>绘制箱形图,以实现对数据中的<span style="color: black;">反常</span>值进行检测。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">41.16、关于空值和缺失值,NaN和None是完全<span style="color: black;">同样</span>的。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">42.17、notnull()与isnull()<span style="color: black;">办法</span>都<span style="color: black;">能够</span>判断数据中<span style="color: black;">是不是</span>存在空值或缺失值。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">43.18、dropna()<span style="color: black;">办法</span><span style="color: black;">能够</span>删除空值和缺失值</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">44.19、<span style="color: black;">反常</span>值处理中<span style="color: black;">能够</span>基于<span style="color: black;">区别</span>字段的均值和标准差求出<span style="color: black;">反常</span>数据分布范围,<span style="color: black;">而后</span>再对<span style="color: black;">反常</span>范围外 的数据做处理,例如填充为均值</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">45.20、数据处理中,大<span style="color: black;">都数</span><span style="color: black;">状况</span>下重复值是<span style="color: black;">必须</span>去除的,使用数据框的drop_duplicates<span style="color: black;">办法</span><span style="color: black;">就可</span>实现。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">46.21、随机抽样即随机的抽取样本,可<span style="color: black;">运用</span>数据框的sample实现,并可<span style="color: black;">经过</span>参数n设置指 定抽样数量,或<span style="color: black;">经过</span>frac指定抽样比例。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">47.22、字符串和日期的转换,可<span style="color: black;">经过</span>time或datetime库的strptime和strftime实现。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">48.23、数据标准化<span style="color: black;">经过</span>将数据按比例缩放,使之落入一个小的特定区间 对象的操作。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">49.24、MaxMin<span style="color: black;">办法</span>则是<span style="color: black;">按照</span>原始数据的最大值和最小值做数据处理,它将数据缩 放为特定范围内。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">50.25、丢弃缺失值是直接将含有NA值的记录丢弃,适用于NA值的记录较少,且整体 样本量<span style="color: black;">很强</span>的<span style="color: black;">状况</span>。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-6w9my0ksvp/dec328b65e5c40c89286af009bd01f23~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1723345396&x-signature=DtIlb5aC34XYp8iH8MCNthUL1Og%3D" style="width: 50%; margin-bottom: 20px;"></p>
你字句如珍珠,我珍藏这份情。 谢谢、感谢、感恩、辛苦了、有你真好等。 楼主果然英明!不得不赞美你一下! 在遇到你之前,我对人世间是否有真正的圣人是怀疑的。 “NB”(牛×的缩写,表示叹为观止)
页:
[1]