  • 工作学习 / 学科技术 / 请问谁有Polybase访问hadoop hive的经验,performance如何?现在用户需要一个工具访问SQLServer和hadoop,基于他们已有的SQLServer经验,似乎polybase是最好的选择,但是不知道是否好用。谢谢
    • 那种所谓Data federation的概念。没用过polybase不敢说, 但是以我对IBM 类似产品的理解和经验,从用户的角度来讲应该是透明的。
      至于说性能,如果你确定后台是Hive,大致来讲可以通过external table, partition and/or bucket, parquet +snappy, analyze, etc to improve performance. But again, theses are something supposed to be done by dba/architect, from the data consumers perspective, nothing but sql.
      • 谢谢,这个solution是architect决定的,不会有大变化,就是想问问performance如何。另外希望对客户是容易使用的
        • 去年试过Azure sql data warehouse loading csv from blob using polybase - performance 比别的方案好 - 最重要的是能通过花钱加 dwu scale out - 用这类东西主要看能不能 scale out...