尼玛历时4天终于把soyun整理好了 .....

sy.png

不要问我经历了什么...都是泪....这种质量的裤子上次见到还是网易52G内次...
去重复共得到3.5E有效数据,
只保留了 用户 密码 邮箱 ,其他栏位全部删掉了 ,
lw.png


原始数据为mssql,导出成TXT,去重复,导入到MYSQL , 这是理想中,,,现实中就是 你特么导出以后因为原始裤子编码就是乱的
导致你导入不进去,,, 这尼玛 !!!! 我想哭有没有!!!
最后选择Navicat Premium,mssql转MYSQL,才导入进去的!
TXT最终大小 14.1 GB (15,168,928,264 字节)(只包括用户密码邮箱)

最开始先建立好表,导入完成后索引,发现根本索引不上去,

alter table soyun add index index_soyun(name(50),email(50));

跑了4天 ,索引上去4G ,气死了 ,,

最后选择建立好表,索引栏位,导入数据,,,特么的也历时4天,,,
最后,求大神交流一下,索引好慢.....


发表评论

  • OωO
  • |´・ω・)ノ
  • ヾ(≧∇≦*)ゝ
  • (☆ω☆)
  • (╯‵□′)╯︵┴─┴
  •  ̄﹃ ̄
  • (/ω\)
  • ∠(ᐛ」∠)_
  • (๑•̀ㅁ•́ฅ)
  • →_→
  • ୧(๑•̀⌄•́๑)૭
  • ٩(ˊᗜˋ*)و
  • (ノ°ο°)ノ
  • (´இ皿இ`)
  • ⌇●﹏●⌇
  • (ฅ´ω`ฅ)
  • (╯°A°)╯︵○○○
  • φ( ̄∇ ̄o)
  • (งᵒ̌皿ᵒ̌)ง⁼³₌₃
  • (ó﹏ò。)
  • Σ(っ°Д°;)っ
  • ╮(╯▽╰)╭
  • o(*
  • >﹏<
  • (。•ˇ‸ˇ•。)
  • 泡泡
  • 颜文字

*

已有 6 条评论
  1. 求解,soyun的编码乱码怎么弄,你是转存成SQL文件,再用.sql导入的吗,我是导出csv再导入的,但是看着乱码好难受,还有表经常崩溃你那里出现过吗

    1. @kitten对 他原始文件里编码就有错误,我这里到没有表崩溃的情况 我转换成MYSQL的了 。

  2. 我觉得你应该name和email各自建索引,没必要联合索引吧